Python 

PARA TODOS 


Raul Gonzålez Duque 



Python 

PARA TODOS 


Raul Gonzålez Duque 



Python para todos 

por Raul Gonzålez Duque 


Este libro se distribuye bajo una licencia Creative Commons Reconocimien- 
to 2.5 Espana. Usted es libre de: 

copiar, distribuir y comunicar publicamente la obra 

hacer obras derivadas 



Bajo las condiciones siguientes: 

Reconocimiento. Debe reconocer y dar crédito al autor original 
(Raul Gonzålez Duque) 



Puede descargar la version mås reciente de este libro gratuitamente en la web 
http:// mundogeek. net/tutorial-python/ 


La imågen de portada es una fotografia de una piton verde de la especie 
Morelia viridis cuyo autor es Ian Chien. La fotografia estå licenciada bajo 
Creative Commons Attribution ShareAlike 2.0 


CONTENIDO 


Introduccion 

7 

<:Qué es Python? 

7 

<:Por qué Python? 

8 

Instalacion de Python 

9 

Herramientas båsicas 

10 

Mi primer programa en Python 

12 

Tipos båsicos 

15 

Numeros 

16 

Cadenas 

21 

Booleanos 

22 

Colecciones 

24 

Listas 

24 

Tuplas 

26 

Diccionarios 

27 

Control de flujo 

29 

Sentencias condicionales 

29 

Bucles 

32 

Funciones 

36 

Orientacion a Objetos 

42 

Clases y objetos 

42 

Herencia 

45 

Herencia multiple 

46 

Polimorfismo 

47 

Encapsulacion 

48 

Clases de “nuevo-estilo” 

50 

Métodos especiales 

50 

Revisitando Objetos 

53 

Diccionarios 

53 

Cadenas 

54 

Listas 

55 


Programacion funcional 5 7 

Funciones de orden superior 57 

Iteraciones de orden superior sobre listas 59 

Funciones lambda 60 

Comprension de listas 61 

Generadores 62 

Decoradores 63 

Excepciones 65 

Modulos y Paquetes 72 

Modulos 72 

Paquetes 75 

Entrada/Salida Y Ficheros 77 

Entrada eståndar 77 

Paråmetros de linea de comando 78 

Salida eståndar 78 

Archivos 82 

Expresiones Regulares 85 

Patrones 85 

Usando el modulo re 89 

Sockets 92 

Interactuar con webs 96 

Threads 102 

<;Qué son los procesos y los threads? 102 

El GIL 103 

Threads en Python 104 

Sincronizacion 106 

Datos globales independientes 111 

Compartir informacion 111 

Serializacion de objetos 113 

Bases de Datos 117 

DB API 117 

Otras opciones 124 

Documentacion 125 

Docstrings 125 

Pydoc 126 

Epydoc y reStructuredText 127 

Pruebas 135 

Doctest 135 

unittest / PyUnit 139 


Distribuir aplicaciones Python 143 

dis tutils 143 

setuptools 147 

Crear ejecutables .exe 152 

Indice 155 


INTRODUCCION 


cQué es Python? 

Python es un lenguaje de programacion creado por Guido van Rossum 
a principios de los anos 90 cuyo nombre estå inspirado en el grupo de 
comicos ingleses “Monty Python”. Es un lenguaje similar a Perl, pero 
con una sintaxis muy limpia y que favorece un codigo legible. 

Se trata de un lenguaje interpretado o de script, con tipado dinåmico, 
fuertemente tipado, multiplataforma y orientado a objetos. 

Lenguaje interpretado o de script 

Un lenguaje interpretado o de script es aquel que se ejecuta utilizando 
un programa intermedio llamado intérprete, en lugar de compilar el 
codigo a lenguaje måquina que pueda comprender y ejecutar directa- 
mente una computadora (lenguajes compilados). 

La ventaja de los lenguajes compilados es que su ejecucion es mås 
råpida. Sin embargo los lenguajes interpretados son mås flexibles y mås 
portables. 

Python tiene, no obstante, muchas de las caracteristicas de los lengua¬ 
jes compilados, por lo que se podria decir que es semi interpretado. En 
Python, como en Java y muchos otros lenguajes, el codigo fuente se 
traduce a un pseudo codigo måquina intermedio llamado bytecode la 
primera vez que se ejecuta, generando archivos .pyc o .pyo (bytecode 
optimizado), que son los que se ejecutarån en sucesivas ocasiones. 


Tipado dinåmico 

La caracteristica de tipado dinåmico se redere a que no es necesario 
declarar el tipo de dato que va a contener una determinada variable, 
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sino que su tipo se determinarå en tiempo de ejecucion segun el tipo 
del valor al que se asigne, y el tipo de esta variable puede cambiar si se 
le asigna un valor de otro tipo. 

Fuertemente tipado 

No se permite tratar a una variable como si fuera de un tipo distinto 
al que tiene, es necesario convertir de forma explicita dicha variable 
al nuevo tipo previamente. Por ejemplo, si tenemos una variable que 
contiene un texto (variable de tipo cadena o string) no podremos tra- 
tarla como un numero (sumar la cadena "9" y el numero 8). En otros 
lenguajes el tipo de la variable cambiaria para adaptarse al comporta- 
miento esperado, aunque esto es mås propenso a errores. 

Multiplataforma 

El intérprete de Python estå disponible en multitud de plataformas 
(UNIX, Solaris, Linux, DOS, Windows, OS/2, Mac OS, etc.) por lo 
que si no utilizamos librerias especificas de cada plataforma nuestro 
programa podrå correr en todos estos sistemas sin grandes cambios. 

Orientado a objetos 

La orientacion a objetos es un paradigma de programacion en el que 
los conceptos del mundo real relevantes para nuestro problema se tras- 
ladan a clases y objetos en nuestro programa. La ejecucion del progra¬ 
ma consiste en una serie de interacciones entre los objetos. 

Python también permite la programacion imperativa, programacion 
funcional y programacion orientada a aspectos. 

lP or qué Python? 

Python es un lenguaje que todo el mundo deberia conocer. Su sintaxis 
simple, clara y sencilla; el tipado dinåmico, el gestor de memoria, la 
gran cantidad de librerias disponibles y la potencia del lenguaje, entre 
otros, hacen que desarrollar una aplicacion en Python sea sencillo, muy 
råpido y, lo que es mås importante, divertido. 

La sintaxis de Python es tan sencilla y cercana al lenguaje natural que 
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los programas elaborados en Python parecen pseudocodigo. Por este 
motivo se trata ademås de uno de los mejores lenguajes para comenzar 
a programar. 

Python no es adecuado sin embargo para la programacion de baj o 
nivel o para aplicaciones en las que el rendimiento sea critico. 

Algunos casos de éxito en el uso de Python son Google, Yahoo, la 
NASA, Industrias Light & Magic, y todas las distribuciones Linux, en 
las que Python cada vez representa un tanto por ciento mayor de los 
programas disponibles. 

Instalacién de Python 

Existen varias implementaciones distintas de Python: CPython, 
Jython, IronPython, PyPy, etc. 

CPython es la mås utilizada, la mås råpida y la mås madura. Cuando la 
gente habla de Python normalmente se refiere a esta implementacion. 
En este caso tanto el intérprete como los modulos estån escritos en C. 

Jython es la implementacion en Java de Python, mientras que 
IronPython es su contrapartida en C# (.NET). Su interés estriba en 
que utilizando estas implementaciones se pueden utilizar todas las 
librerias disponibles para los programadores de Java y .NET. 

PyPy, por ultimo, como habréis adivinado por el nombre, se trata de 
una implementacion en Python de Python. 


CPython estå instalado por defecto en la mayor parte de las distribu¬ 
ciones Linux y en las ultimas versiones de Mac OS. Para comprobar si 
estå instalado abre una terminal y escribe python. Si estå instalado se 
iniciarå la consola interactiva de Python y obtendremos parecido a lo 
siguiente: 

Python 2.5.1 (r251:54863, May 2 2007, 16:56:35) 

[GCC 4.1.2 (Ubuntu 4.1.2-Øubuntu4)] on linux2 

Type "help", "copyright", "credits" or "license" for more 

information. 

>» 
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La primera linea nos indica la version de Python que tenemos ins- 
talada. Al final podemos ver el prompt (»>) que nos indica que el 
intérprete estå esperando codigo del usuario. Podemos salir escribiendo 
ex i t (), o pulsando Control + D. 

Si no te muestra algo parecido no te preocupes, instalar Python es muy 
sencillo. Puedes descargar la version correspondiente a tu sistema ope¬ 
rativo desde la web de Python, en http://www.python.org/download/ . 
Existen instaladores para Windows y Mac OS. Si utilizas Linux es 
muy probable que puedas instalarlo usando la herramienta de gestion 
de paquetes de tu distribucion, aunque también podemos descargar la 
aplicacion compilada desde la web de Python. 

Herramientas båsicas 

Existen dos formas de ejecutar codigo Python. Podemos escribir lfneas 
de codigo en el intérprete y obtener una respuesta del intérprete para 
cada linea (sesion interactiva) o bien podemos escribir el codigo de un 
programa en un archivo de texto y ejecutarlo. 

A la hora de realizar una sesion interactiva os aconsejo instalar y uti- 
lizar iPython, en lugar de la consola interactiva de Python. Se puede 
encontrar en http://ipython.scipy.org/. iPython cuenta con caracterfsticas 
anadidas muy interesantes, como el autocompletado o el operador ?. 
(para activar la caracterfstica de autocompletado en Windows es nece- 
sario instalar PyReadline, que puede descargarse desde http://ipython. 
scipy. org/ moin/PyReadline/Intro ) 

La funcion de autocompletado se lanza pulsando el tabulador. Si 
escribimos f i y pulsamos Tab nos mostrarå una lista de los objetos 
que comienzan con fi (file, filter y final ly). Si escribimos f ile.y 
pulsamos Tab nos mostrarå una lista de los métodos y propiedades del 
objeto file. 

El operador ? nos muestra informacion sobre los objetos. Se utiliza 
anadiendo el sfmbolo de interrogacion al final del nombre del objeto 
del cual queremos mås informacion. Por ejemplo: 

In [3]: str? 
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Type: type 
Base Class: 

String Form: 

Namespace: Python builtin 
Docstring: 

str(object) -> string 

Return a nice string representat ion of the object. 

If the argument is a string, the return value is the same 
object. 

En el campo de IDEs y editores de codigo gratuitos PyDEV ( http:// 
pydev.sourceforge.net/) se alza como cabeza de serie. PyDEV es un plu- 
gin para Eclipse que permite utilizar este IDE multiplataforma para 
programar en Python. Cuenta con autocompletado de codigo (con 
informacion sobre cada elemento), resaltado de sintaxis, un depurador 
gråfico, resaltado de errores, explorador de clases, formateo del codigo, 
refactorizacion, etc. Sin duda es la opcion mås completa, sobre todo si 
instalamos las extensiones comerciales, aunque necesita de una canti- 
dad importante de memoria y no es del todo estable. 

Otras opciones gratuitas a considerar son SPE o Stani s Python Editor 
( http://sourceforge. net/pr ojects/speZ), Eric (http://die-offenbachs.de/eric/), 
BOA Constructor (http://boa-constructor.sourceforge.net/) o incluso 
emacs o vim. 

Si no te importa desembolsar algo de dinero, Komodo (http.Z/www. 
activestate.com/komodo_ide/) y Wing IDE (http://www.wingware.com/) 
son también muy buenas opciones, con montones de caracteristicas 
interesantes, como PyDEV, pero mucho mås estables y robustos. Ade- 
mås, si desarrollas software libre no comercial puedes contactar con 
Wing Ware y obtener, con un poco de suerte, una licencia gratuita para 
Wing IDE Professional:) 
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Ml PRIMER 
PROGRAMA EN 
PYTHON 


Como comentåbamos en el capitulo anterior existen dos formas de 
ejecutar codigo Python, bien en una sesion interactiva (linea a linea) 
con el intérprete, o bien de la forma habitual, escribiendo el codigo en 
un archivo de codigo fuente y ejecutåndolo. 

El primer programa que vamos a escribir en Python es el clåsico Hola 
Mundo, y en este lenguaje es tan simple como: 

print "Hola Mundo" 

Vamos a probarlo primero en el intérprete. Ejecuta python o ipython 
segun tus preferencias, escribe la linea anterior y pulsa Enter. El intér¬ 
prete responderå mostrando en la consola el texto Hola Mundo. 

Vamos ahora a crear un archivo de texto con el codigo anterior, de 
forma que pudiéramos distribuir nuestro pequeno gran programa entre 
nuestros amigos. Abre tu editor de texto preferido o bien el IDE que 
hayas elegido y copia la linea anterior. Guårdalo como hola.py, por 
ejemplo. 

Ejecutar este programa es tan sencillo como indicarle el nombre del 
archivo a ejecutar al intérprete de Python 

python hola.py 
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pero vamos a ver como simplificarlo aun mås. 

Si utilizas Windows los archivos .py ya estarån asociados al intérprete 
de Python, por lo que basta hacer doble clic sobre el archivo para eje- 
cutar el programa. Sin embargo como este programa no hace mås que 
imprimir un texto en la consola, la ejecucion es demasiado råpida para 
poder verlo si quiera. Para remediarlo, vamos a anadir una nueva linea 
que espere la entrada de datos por parte del usuario. 

print "Hola Mundo" 
raw_input() 

De esta forma se mostrarå una consola con el texto Hola Mundo hasta 
que pulsemos Enter. 

Si utilizas Linux (u otro Unix) para conseguir este comportamiento, es 
decir, para que el sistema operativo abra el archivo .py con el intérprete 
adecuado, es necesario anadir una nueva linea al principio del archivo: 

#! /usr/bin/python 
print "Hola Mundo" 
raw_input() 

A esta linea se le conoce en el mundo Unix como shebang , hashbang 
o sharpbang. El par de caracteres #! indica al sistema operativo que 
dicho script se debe ejecutar utilizando el intérprete especificado a 
continuacion. De esto se desprende, evidentemente, que si esta no es la 
ruta en la que estå instalado nuestro intérprete de Python, es necesario 
cambiarla. 


Otra opcion es utilizar el programa env (de environment, entorno) 
para preguntar al sistema por la ruta al intérprete de Python, de forma 
que nuestros usuarios no tengan ningun problema si se diera el caso de 
que el programa no estuviera instalado en dicha ruta: 


#!/usr/bin/env python 
print "Hola Mundo" 
raw_input() 


Por supuesto ademås de anadir el shebang, tendremos que dar permi¬ 
sos de ejecucion al programa. 
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chmod +x hola.py 

Y listo, si hacemos doble clic el programa se ejecutarå, mostrando una 
consola con el texto Hola Mundo, como en el caso de Windows. 

También podriamos correr el programa desde la consola como si trata- 
ra de un ejecutable cualquiera: 

./hola.py 
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En Python los tipos båsicos se dividen en: 

• Numeros, como pueden ser 3 (entero), 15.57 (de coma flotante) o 
7 + 5 j (complejos) 

• Cadenas de texto, como "Hola Mundo" 

• Valores booleanos: True (cierto) y False (falso). 

Vamos a crear un par de variables a modo de ejemplo. Una de tipo 
cadena y una de tipo entero: 

# esto es una cadena 
c = "Hola Mundo" 

# y esto es un entero 
e = 23 

# podemos comprobarlo con la funcion type 
type(c) 

type(e) 

Como veis en Python, a diferencia de muchos otros lenguajes, no se 
declara el tipo de la variable al crearla. En Java, por ejemplo, escribiria- 
mos: 

String c = "Hola Mundo"; 
int e = 23; 


Este pequeno ejemplo también nos ha servido para presentar los 
comentarios inline en Python: cadenas de texto que comienzan con el 
caråcter # y que Python ignora totalmente. Hay mås tipos de comenta¬ 
rios, de los que hablaremos mås adelante. 
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Numeros 

Como deciamos, en Python se pueden representar numeros enteros, 
reales y complejos. 

Enteros 

Los numeros enteros son aquellos numeros positivos o negativos que 
no tienen decimales (ademås del cero). En Python se pueden repre¬ 
sentar mediante el tipo int (de integer, entero) o el tipo long (largo). 
La unica diferencia es que el tipo long permite almacenar numeros 
mås grandes. Es aconsejable no utilizar el tipo long a menos que sea 
necesario, para no malgastar memoria. 

El tipo int de Python se implementa a bajo nivel mediante un tipo 
long de C. Y dado que Python utiliza C por debajo, como C, y a dife¬ 
rencia de Java, el rango de los valores que puede representar depende 
de la plataforma. 

En la mayor parte de las måquinas el long de C se almacena utilizando 
32 bits, es decir, mediante el uso de una variable de tipo int de Python 
podemos almacenar numeros de -2 31 a 2 31 - 1, o lo que es lo mismo, de 
-2.147.483.648 a 2.147.483.647. En plataformas de 64 bits, el rango es 
de -9.223.372.036.854.775.808 hasta 9.223.372.036.854.775.807. 

El tipo long de Python permite almacenar numeros de cualquier preci- 
sion, estando limitados solo por la memoria disponible en la måquina. 

Al asignar un numero a una variable esta pasarå a tener tipo int, a 
menos que el numero sea tan grande como para requerir el uso del tipo 
long. 

# type(entero) devolverla int 
entero = 23 

También podemos indicar a Python que un numero se almacene usan¬ 
do long anadiendo una L al final: 

# type(entero) devolverla long 
entero = 23L 
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El literal que se asigna a la variable también se puede expresar como 
un octal, anteponiendo un cero: 

# 027 octal = 23 en base 10 
entero = 027 

o bien en hexadecimal, anteponiendo un Ox: 

# 0x17 hexadecimal = 23 en base 10 
entero = 0x17 

Reales 

Los numeros reales son los que tienen decimales. En Python se expre- 
san mediante el tipo f loat. En otros lenguajes de programacion, como 
C, tenemos también el tipo double, similar a f loat pero de mayor 
precision (double = doble precision). Python, sin embargo, implementa 
su tipo f loat a bajo nivel mediante una variable de tipo double de C, 
es decir, utilizando 64 bits, luego en Python siempre se utiliza doble 
precision, y en concreto se sigue el eståndar IEEE 754: 1 bit para el 
signo, 11 para el exponente, y 52 para la mantisa. Esto significa que los 
valores que podemos representar van desde ±2,2250738585072020 x 
10 308 hasta ±l,7976931348623157xl0 308 . 

La mayor parte de los lenguajes de programacion siguen el mismo 
esquema para la representacion interna. Pero como muchos sabréis 
esta tiene sus limitaciones, impuestas por el hardware. Por eso desde 
Python 2.4 contamos también con un nuevo tipo Decimal, para el 
caso de que se necesite representar fracciones de forma mås precisa. 

Sin embargo este tipo estå fuera del alcance de este tutorial, y solo es 
necesario para el åmbito de la programacion cientifica y otros rela- 
cionados. Para aplicaciones normales podeis utilizar el tipo f loat sin 
miedo, como ha venido haciéndose desde hace anos, aunque teniendo 
en cuenta que los numeros en coma flotante no son precisos (ni en este 
ni en otros lenguajes de programacion). 

Para representar un numero real en Python se escribe primero la parte 
entera, seguido de un punto y por ultimo la parte decimal. 

real = 0.2703 
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También se puede utilizar notation cientifica, y anadir una e (de expo- 
nente) para indicar un exponente en base 10. Por ejemplo: 

real = 0.1e-3 

seria equivalente a 0.1 x 10-3 = 0.1 x 0.001 = 0.0001 

Complejos 

Los numeros complejos son aquellos que tienen parte imaginaria. Si 
no conotias de su existencia, es mås que probable que nunca lo vayas a 
necesitar, por lo que puedes saltarte este apartado tranquilamente. De 
hecho la mayor parte de lenguajes de programacion carecen de este 
tipo, aunque sea muy utilizado por ingenieros y cientificos en general. 

En el caso de que necesitéis utilizar numeros complejos, o simplemen- 
te tengåis curiosidad, os diré que este tipo, llamado complex en Python, 
también se almacena usando coma flotante, debido a que estos nume¬ 
ros son una extension de los numeros reales. En concreto se almacena 
en una estructura de C, compuesta por dos variables de tipo double, 
sirviendo una de ellas para almacenar la parte real y la otra para la 
parte imaginaria. 

Los numeros complejos en Python se representan de la siguiente 
forma: 

complejo = 2.1 + 7.8j 

Operadores 

Veamos ahora qué podemos hacer con nuestros numeros usando los 
operadores por defecto. Para operaciones mås complejas podemos 
recurrir al modulo math. 

Operadores aritméticos 


Operador 

Descripcion 

Ejemplo 

+ 

Suma 

r=3+2 # r es 5 

- 

Resta 

r = 4 - 7 # r es -3 
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Operador 

Descripcion 

Ejemplo 

- 

Negacion 

r = -7 # r es -7 

* 

Multiplicacion 

r = 2 * 6 # r es 12 

* * 

Exponente 

r = 2 ** 6 # r es 64 

/ 

Division 

r = 3.5 / 2 # r es 1.75 

// 

Division entera 

r = 3.5 // 2 # r es 1.0 

% 

Modulo 

r = 7 % 2 # r es 1 


Puede que tengåis dudas sobre como funciona el operador de modulo, 
y cuål es la diferencia entre division y division entera. 

El operador de modulo no hace otra cosa que devolvernos el resto de 
la division entre los dos operandos. En el ejemplo, 7/2 seria 3, con 1 de 
resto, luego el modulo es 1. 

La diferencia entre division y division entera no es otra que la que 
indica su nombre. En la division el resultado que se devuelve es un 
numero real, mientras que en la division entera el resultado que se 
devuelve es solo la parte entera. 

No obstante hay que tener en cuenta que si utilizamos dos operandos 
enteros, Python determinarå que queremos que la variable resultado 
también sea un entero, por lo que el resultado de, por ejemplo, 3 / 2 y 
3 // 2 seria el mismo: 1. 

Si quisiéramos obtener los decimales necesitariamos que al menos uno 
de los operandos fuera un numero real, bien indicando los decimales 

r = 3.0 / 2 

o bien utilizando la funcion f loat (no es necesario que sepais lo que 
significa el término funcion, ni que recordeis esta forma, lo veremos un 
poco mås adelante): 

r = float(3) / 2 

Esto es asi porque cuando se mezclan tipos de numeros, Python con- 
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vierte todos los operandos al tipo mås complejo de entre los tipos de 
los operandos. 

Operadores a nivel de bit 

Si no conocéis estos operadores es poco probable que vayåis a necesi- 
tarlos, por lo que podéis obviar esta parte. Si aun asi tenéis curiosidad 
os diré que estos son operadores que actuan sobre las representaciones 
en binario de los operandos. 

Por ejemplo, si veis una operacion como 3 & 2, lo que estais viendo es 
un and bit a bit entre los numeros binarios 11 y 10 (las representacio¬ 
nes en binario de 3 y 2). 

El operador and (&), del inglés “y”, devuelve 1 si el primer bit operando 
es 1 y el segundo bit operando es 1 . Se devuelve 0 en caso contrario. 

El resultado de aplicar and bit a bit a 11 y 10 seria entonces el numero 
binario 10, o lo que es lo mismo, 2 en decimal (el primer digito es 1 
para ambas cifras, mientras que el segundo es 1 solo para una de ellas). 

El operador or (I), del inglés “o”, devuelve 1 si el primer operando es 1 
o el segundo operando es 1. Para el resto de casos se devuelve 0. 

El operador xor u or exclusivo ( A ) devuelve 1 si uno de los operandos 
es 1 y el otro no lo es. 

El operador not (~), del inglés “no”, sirve para negar uno a uno cada 
bit; es decir, si el operando es 0, cambia a 1 y si es 1, cambia a 0. 

Por ultimo los operadores de desplazamiento (« y ») sirven para 
desplazar los bits n posiciones hacia la izquierda o la derecha. 


Operador 

Descripcion 

Ejemplo 

& 

and 

r = 3 & 2 #res2 

1 

or 

r=3l2 #res3 

A 

xor 

r=3 A 2 #res1 

~ 

not 

r = ~3 # r es -4 
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« 

Desplazamiento izq. 

r = 3 << 1 # r es 6 

» 

Desplazamiento der. 

r = 3 » 1 # r es 1 


Cadenas 

Las cadenas no son mås que texto encerrado entre comillas simples 
('cadena') o dobles (" cadena "). Dentro de las comillas se pueden 
anadir caracteres especiales escapåndolos con \, como \n, el caråcter de 
nueva linea, o \t, el de tabulacion. 

Una cadena puede estar precedida por el caråcter u o el caråcter r, los 
cuales indican, respectivamente, que se trata de una cadena que utiliza 
codificacion Unicode y una cadena raw (del inglés, cruda). Las cade¬ 
nas raw se distinguen de las normales en que los caracteres escapados 
mediante la barra invertida (\) no se sustituyen por sus contrapartidas. 
Esto es especialmente util, por ejemplo, para las expresiones regulares, 
como veremos en el capitulo correspondiente. 

Unicode = u"åoé" 
raw = r"\n" 


También es posible encerrar una cadena entre triples comillas (simples 
o dobles). De esta forma podremos escribir el texto en varias lineas, y 
al imprimir la cadena, se respetarån los saltos de linea que introdujimos 
sin tener que recurrir al caråcter \n, asi como las comillas sin tener que 
escaparlas. 

triple = """primera linea 

esto se vera en otra linea""" 

Las cadenas también admiten operadores como +, que funciona reali- 
zando una concatenacion de las cadenas utilizadas como operandos y 
*, en la que se repite la cadena tantas veces como lo indique el numero 
utilizado como segundo operando. 

a = "uno" 
b = "dos" 

c=a+b#ces "unodos" 
c = a * 3 # c es "unounouno" 
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Booleanos 

Como deciamos al comienzo del capitulo una variable de tipo boolea- 
no solo puede tener dos valores: True (cierto) y False (falso). Estos 
valores son especialmente importantes para las expresiones condicio- 
nales y los budes, como veremos mås adelante. 

En realidad el tipo bool (el tipo de los booleanos) es una subclase del 
tipo i n t. Puede que esto no tenga mucho sentido para ti si no conoces 
los términos de la orientacion a objetos, que veremos mås adelante, 
aunque tampoco es nada importante. 

Estos son los distintos tipos de operadores con los que podemos traba- 
jar con valores booleanos, los llamados operadores logicos o condicio- 
nales: 


Operador 

Descripcion 

Ejemplo 

and 

^se cumple a y b? 

r = True and False # r es 
False 

or 

<;se cumple a o b? 

r = True or False # r es 
True 

not 

No a 

r = not True # r es 

False 


Los valores booleanos son ademås el resultado de expresiones que 
utilizan operadores relacionales (comparaciones entre valores): 


Operador 

Descripcion 

Ejemplo 

== 

<:son iguales a y b? 

r = 5 == 3 # r es 
False 

! = 

<:son distintos a y b? 

r = 5 != 3 # r es 

True 

< 

<;es a menor que b? 

r = 5 < 3 #res 
False 

> 

<:es a mayor que b? 

r = 5 > 3 #res 

True 
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<= 

<:es a menor o igual que b? 

r = 5 <= 5 # r es 

True 

>= 

<;es a mayor o igual que b? 

r = 5 >= 3 # r es 

True 
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En el capftulo anterior vimos algunos tipos båsicos, como los numeros, 
las cadenas de texto y los booleanos. En esta leccion veremos algunos 
tipos de colecciones de datos: listas, tuplas y diccionarios. 

Listas 

La lista es un tipo de coleccion ordenada. Seria equivalente a lo que en 
otros lenguajes se conoce por arrays, o vectores. 

Las listas pueden contener cualquier tipo de dato: numeros, cadenas, 
booleanos, ... y también listas. 

Crear una lista es tan sencillo como indicar entre corchetes, y separa- 
dos por comas, los valores que queremos incluir en la lista: 

1 = [22, True, "una lista", [1, 2]] 

Podemos acceder a cada uno de los elementos de la lista escribiendo el 
nombre de la lista e indicando el indice del elemento entre corchetes. 
Ten en cuenta sin embargo que el indice del primer elemento de la 
lista es 0, y no 1: 

1 = [11, False] 

mi_var = 1[0] # mi_var vale 11 


Si queremos acceder a un elemento de una lista incluida dentro de otra 
lista tendremos que utilizar dos veces este operador, primero para in¬ 
dicar a qué posicion de la lista exterior queremos acceder, y el segundo 
para seleccionar el elemento de la lista interior: 

1 = ["una lista", [1, 2]] 
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mi_var = 1[1][0] # mi_var vale 1 

También podemos utilizar este operador para modificar un elemento 
de la lista si lo colocamos en la parte izquierda de una asignacion: 

1 = [22, True] 

1[0] = 99 # Con esto 1 valdrå [99, True] 

El uso de los corchetes para acceder y modificar los elementos de una 
lista es comun en muchos lenguajes, pero Python nos depara varias 
sorpresas muy agradables. 

Una curiosidad sobre el operador [ ] de Python es que podemos utili¬ 
zar también numeros negativos. Si se utiliza un numero negativo como 
fndice, esto se traduce en que el fndice empieza a contar desde el final, 
hacia la izquierda; es decir, con [ -1 ] accederfamos al ultimo elemento 
de la lista, con [ - 2 ] al penultimo, con [ - 3 ], al antepenultimo, y asf 
sucesivamente. 

Otra cosa inusual es lo que en Python se conoce como slicing o parti- 
cionado, y que consiste en ampliar este mecanismo para permitir selec- 
cionar porciones de la lista. Si en lugar de un numero escribimos dos 
numeros inicioyfin separados por dos puntos (inicio:fin) Python 
interpretarå que queremos una lista que vaya desde la posicion inicio 
a la posicion fin, sin incluir este ultimo. Si escribimos tres numeros 
(inicio:fin:salto)en lugar de dos, el tercero se utiliza para determi¬ 
nar cada cuantas posiciones anadir un elemento a la lista. 

1 = [99, True, "una lista", [1, 2]] 

mi_var = 1[0:2] # mi_var vale [99, True] 

mi_var = 1[0:4:2] # mi_var vale [99, "una lista"] 

Los numeros negativos también se pueden utilizar en un slicing, con el 
mismo comportamiento que se comento anteriormente. 

Hay que mencionar asf mismo que no es necesario indicar el principio 
y el final del slicing, sino que, si estos se omiten, se usarån por defecto 
las posiciones de inicio y fin de la lista, respectivamente: 

1 = [99, True, "una lista"] 

mi_var = l[1:j # mi_var vale [True, "una lista"] 
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mi_var = l[ 
mi_var = 1[ 
mi_var = l[ 


2] # mi_var vale [99, True] 

] # mi_var vale [99, True, "una lista"] 

:2] # mi_var vale [99, "una lista"] 


También podemos utilizar este mecanismo para modificar la lista: 

1 = [99, True, "una lista", [1, 2]] 

1[0:2] = [0, 1] # 1 vale [0, 1, "una lista", [1, 2]] 


pudiendo incluso modificar el tamano de la lista si la lista de la parte 
derecha de la asignacion tiene un tamano menor o mayor que el de la 
seleccion de la parte izquierda de la asignacion: 

1[0:2] = [False] # 1 vale [False, "una lista", [1, 2]] 


En todo caso las listas ofrecen mecanismos mås comodos para ser mo- 
dificadas a través de las funciones de la clase correspondiente, aunque 
no veremos estos mecanismos hasta mås adelante, después de explicar 
lo que son las clases, los objetos y las funciones. 


Tiiplas 

Todo lo que hemos explicado sobre las listas se aplica también a las 
tuplas, a excepcion de la forma de definirla, para lo que se utilizan 
paréntesis en lugar de corchetes. 

t = (1, 2, True, "python") 

En realidad el constructor de la tupla es la coma, no el paréntesis, pero 
el intérprete muestra los paréntesis, y nosotros deberfamos utilizarlos, 
por claridad. 

»> t = 1, 2, 3 
»> type(t) 
type "tuple" 


Ademås hay que tener en cuenta que es necesario anadir una coma 
para tuplas de un solo elemento, para diferenciarlo de un elemento 
entre paréntesis. 


»> t = (1) 

»> type(t) 
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type "int" 

»> t = (i,) 

»> type(t) 
type "tuple" 

Para referirnos a elementos de una tupla, como en una lista, se usa el 
operador [ ]: 

mi_var = t[0] # mi_var es 1 
mi_var = t[0:2] # mi_var es (1, 2) 

Podemos utilizar el operador [ ] debido a que las tuplas, al igual que 
las listas, forman parte de un tipo de objetos llamados secuencias. 
Permitirme un pequeno inciso para indicaros que las cadenas de texto 
también son secuencias, por lo que no os extranarå que podamos hacer 
cosas como estas: 

c = "hola mundo" 
c [ 0 ] # h 

c[5:] # mundo 

c[::3] # hauo 

Volviendo al tema de las tuplas, su diferencia con las listas estriba en 
que las tuplas no poseen estos mecanismos de modificacion a través 
de funciones tan utiles de los que hablåbamos al final de la anterior 
seccion. 

Ademås son inmutables, es decir, sus valores no se pueden modificar 
una vez creada; y tienen un tamano fijo. 

A cambio de estas limitaciones las tuplas son mås “ligeras” que las 
listas, por lo que si el uso que le vamos a dar a una coleccion es muy 
båsico, puedes utilizar tuplas en lugar de listas y ahorrar memoria. 

Diccionarios 

Los diccionarios, también llamados matrices asociativas, deben su 
nombre a que son colecciones que relacionan una clave y un valor. Por 
ejemplo, veamos un diccionario de pelfculas y directores: 

d = {"Love Actually "Richard Curtis", 

"Kill Bill": "Tarantino", 
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"Amélie": "Jean-Pierre Jeunet"} 

El primer valor se trata de la clave y el segundo del valor asociado 
a la clave. Como clave podemos utilizar cualquier valor inmutable: 
podriamos usar numeros, cadenas, booleanos, tuplas,... pero no listas 
o diccionarios, dado que son mutables. Esto es asi porque los diccio- 
narios se implementan como tablas hash, y a la hora de introducir un 
nuevo par clave-valor en el diccionario se calcula el hash de la clave 
para después poder encontrar la entrada correspondiente råpidamente. 
Si se modificara el objeto clave después de håber sido introducido en el 
diccionario, evidentemente, su hash también cambiaria y no podria ser 
encontrado. 

La diferencia principal entre los diccionarios y las listas o las tuplas es 
que a los valores almacenados en un diccionario se les accede no por su 
indice, porque de hecho no tienen orden, sino por su clave, utilizando 
de nuevo el operador [ ]. 

d["Love Actually "] # devuelve "Richard Curtis" 

Al igual que en listas y tuplas también se puede utilizar este operador 
para reasignar valores. 

d["Kill Bill"] = "Quentin Tarantino" 

Sin embargo en este caso no se puede utilizar slicing, entre otras cosas 
porque los diccionarios no son secuencias, si no mappings (mapeados, 
asociaciones). 
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En esta leccion vamos a ver los condicionales y los budes. 


Sentencias condicionales 

Si un programa no fuera mås que una lista de ordenes a ejecutar de 
forma secuencial, una por una, no tendria mucha utilidad. Los con¬ 
dicionales nos permiten comprobar condiciones y hacer que nuestro 
programa se comporte de una forma u otra, que ejecute un fragmento 
de codigo u otro, dependiendo de esta condicion. 

Aqui es donde cobran su importancia el tipo booleano y los operadores 
logicos y relacionales que aprendimos en el capitulo sobre los tipos 
båsicos de Python. 


La forma mås simple de un estamento condicional es un i f (del inglés 
si) seguido de la condicion a evaluar, dos puntos (:) y en la siguiente 
linea e indentado, el codigo a ejecutar en caso de que se cumpla dicha 
condicion. 

fav = "mundogeek.net" 

# si (if) fav es igual a "mundogeek.net" 
if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 


Como veis es bastante sencillo. 


Eso si, aseguraros de que indentåis el codigo tal cual se ha hecho en el 
ejemplo, es decir, aseguraros de pulsar Tabulacion antes de las dos or¬ 
denes print, dado que esta es la forma de Python de saber que vuestra 
intention es la de que los dos print se ejecuten solo en el caso de que 
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se cumpla la condicion, y no la de que se imprima la primera cadena si 
se cumple la condicion y la otra siempre, cosa que se expresaria asi: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 


En otros lenguajes de programacion los bloques de codigo se determi¬ 
nan encerråndolos entre liaves, y el indentarlos no se trata mås que de 
una buena pråctica para que sea mås sencillo seguir el flujo del progra¬ 
ma con un solo golpe de vista. Por ejemplo, el codigo anterior expresa- 
do en Java seria algo asi: 

String fav = "mundogeek.net"; 
if (fav.equals("mundogeek.net")){ 

System.out.println("Tienes buen gusto!"); 

System.out.print 1n("Gracias"); 


Sin embargo, como ya hemos comentado, en Python se trata de una 
obligacion, y no de una eleccion. De esta forma se obliga a los progra- 
madores a indentar su codigo para que sea mås sencillo de leer :) 


if... else 

Vamos a ver ahora un condicional algo mås complicado. <;Qué haria- 
mos si quisiéramos que se ejecutaran unas ciertas ordenes en el caso de 
que la condicion no se cumpliera? Sin duda podriamos anadir otro if 
que tuviera como condicion la negacion del primero: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 

if fav != "mundogeek.net": 
print "Vaya, que låstima" 


pero el condicional tiene una segunda construccion mucho mås util: 

if fav == "mundogeek.net": 

print "Tienes buen gusto!" 
print "Gracias" 
else: 

print "Vaya, que låstima" 


30 



Control de flujo 


Vemos que la segunda condicion se puede sustituir con un el se (del 
inglés: si no, en caso contrario). Si leemos el codigo vemos que tiene 
bastante sentido: “si fav es igual a mundogeek.net, imprime esto y esto, 
si no, imprime es to otro”. 

if... elif... elif... else 

Todavia queda una construccion mås que ver, que es la que hace uso 
del elif. 

if numero < 0: 

print "Negativo" 
elif numero > 0: 

print "Positivo" 
else: 

print "Cero" 

elif es una contraccion de else if, por lo tanto elif numero > 0 puede 
leerse como “si no, si numero es mayor que O”. Es decir, primero se 
evalua la condicion del if . Si es cierta, se ejecuta su codigo y se con¬ 
tinua ejecutando el codigo posterior al condicional; si no se cumple, 
se evalua la condicion del elif. Si se cumple la condicion del elif 
se ejecuta su codigo y se continua ejecutando el codigo posterior al 
condicional; si no se cumple y hay mås de un e 1 i f se continua con el 
siguiente en orden de aparicion. Si no se cumple la condicion del i f ni 
de ninguno de los elif, se ejecuta el codigo del else. 

A if C else B 

También existe una construccion similar al operador ? de otros lengua- 
jes, que no es mås que una forma compacta de expresar un if else. En 
esta construccion se evalua el predicado C y se devuelve A si se cumple 
o B si no se cumple:^ if C else B. Veamos un ejemplo: 

var = "par" if (num % 2 == 0) else "impar" 

Y eso es todo. Si conocéis otros lenguajes de programacion puede que 
esperarais que os hablara ahora del switch, pero en Python no existe 
esta construccion, que podria emularse con un simple diccionario, asi 
que pasemos directamente a los budes. 
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Budes 

Mientras que los condicionales nos permiten ejecutar distintos frag¬ 
mentos de codigo dependiendo de ciertas condiciones, los bucles nos 
permiten ejecutar un mismo fragmento de codigo un cierto numero de 
veces, mientras se cumpla una determinada condicion. 

while 

El buele while (mientras) ejecuta un fragmento de codigo mientras se 
cumpla una condicion. 


edad = 0 
while edad < 18: 
edad = edad + 1 

print "Felicidades, tienes " + str(edad) 

La variable edad comienza valiendo 0. Como la condicion de que edad 
es menor que 18 es cierta (0 es menor que 18), se entra en el bucle. 

Se aumenta edad en 1 y se imprime el mensaje informando de que 
el usuario ha eumplido un ano. Recordad que el operador + para las 
cadenas funciona concatenando ambas cadenas. Es necesario utilizar 
la funcion str (de string, cadena) para crear una cadena a partir del 
numero, dado que no podemos concatenar numeros y cadenas, pero ya 
comentaremos esto y mucho mås en proximos capitulos. 

Ahora se vuelve a evaluar la condicion, y 1 sigue siendo menor que 18, 
por lo que se vuelve a ejecutar el codigo que aumenta la edad en un 
ano e imprime la edad en la pantalla. El bucle continuarå ejecutåndose 
hasta que edad sea igual a 18, momento en el cual la condicion dejarå 
de eumplirse y el programa continuaria ejecutando las instrucciones 
siguientes al bucle. 

Ahora imaginemos que se nos olvidara escribir la instruccion que 
aumenta la edad. En ese caso nunca se llegaria a la condicion de que 
edad fuese igual o mayor que 18, siempre seria 0, y el bucle continuaria 
indefinidamente escribiendo en pantalla Has eumplido 0. 

Esto es lo que se conoce como un bucle infinito. 
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Sin embargo hay situaciones en las que un buele infinito es util. Por 
ejemplo, veamos un pequeno programa que repite todo lo que el usua- 
rio diga hasta que escriba ad i os. 

while True: 

entrada = raw_input("> ") 
if entrada == "adios": 

break 

else: 

print entrada 

Para obtener lo que el usuario escriba en pantalla utilizamos la funcion 
raw_input. No es necesario que sepais qué es una funcion ni como 
funciona exactamente, simplemente aceptad por ahora que en cada 
iteracion del buele la variable entrada contendrå lo que el usuario 
escribio hasta pulsar Enter. 

Comprobamos entonces si lo que escribio el usuario fue adios, en cuyo 
caso se ejecuta la orden break o si era cualquier otra cosa, en cuyo caso 
se imprime en pantalla lo que el usuario escribio. 

La palabra clave break (romper) sale del buele en el que estamos. 

Este buele se podria håber escrito también, no obstante, de la siguiente 
forma: 

salir = False 
while not salir: 

entrada = raw_input() 
if entrada == "adios": 

salir = True 
else: 

print entrada 

pero nos ha servido para ver como funciona break. 

Otra palabra clave que nos podemos encontrar dentro de los budes es 
continue (continuar). Como habréis adivinado no hace otra cosa que 
pasar directamente a la siguiente iteracion del bude. 


edad = 0 
while edad < 18: 

33 



Python para todos 


edad = edad + 1 
if edad % 2 == 0: 
continue 

print "Felicidades, tienes " + str(edad) 

Como veis esta es una pequena modificacion de nuestro programa de 
felicitaciones. En esta ocasion hemos anadido un if que comprueba si 
la edad es par, en cuyo caso saltamos a la proxima iteracion en lugar de 
imprimir el mensaje. Es decir, con esta modificacion el programa solo 
imprimina felicitaciones cuando la edad fuera impar. 

for... in 

A los que hayåis tenido experiencia previa con segun que lenguajes este 
buele os va a sorprender gratamente. En Python for se utiliza como 
una forma genérica de iterar sobre una secuencia. Y como tal intenta 
facilitar su uso para este fin. 

Este es el aspecto de un buele for en Python: 

secuencia = ["uno", "dos", "tres"] 
for elemento in secuencia: 
print elemento 

Como hemos dicho los for se utilizan en Python para recorrer secuen- 
cias, por lo que vamos a utilizar un tipo secuencia, como es la lista, para 
nuestro ejemplo. 

Leamos la cabecera del buele como si de lenguaje natural se tratara: 
“para cada elemento en secuencia”. Y esto es exactamente lo que hace 
el buele: para cada elemento que tengamos en la secuencia, ejecuta 
estas lfneas de codigo. 

Lo que hace la cabecera del buele es obtener el siguiente elemento de 
la secuencia secuencia y almacenarlo en una variable de nombre ele¬ 
mento. Por esta razon en la primera iteracion del buele elemento valdrå 
"uno", en la segunda "dos", y en la tercera "tres". 

Facil y sencillo. 

En C o C++, por ejemplo, lo que habrfamos hecho serfa iterar sobre las 
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posiciones, y no sobre los elementos: 

int mi_array[] = {1, 2, 3, 4, 5}; 
int i; 

for(i =0; i < 5; i++) { 

printf("%d\n", mi_array[i]); 

} 


Es decir, tendriamos un buele for que fuera aumentando una variable 
i en cada iteracion, desde 0 al tamano de la secuencia, y utilizariamos 
esta variable a modo de indice para obtener cada elemento e imprimir- 
lo. 

Como veis el enfoque de Python es mås natural e intuitivo. 

Pero, <:qué ocurre si quisiéramos utilizar el for como si estuviéramos en 
C o en Java, por ejemplo, para imprimir los numeros de 30 a 50? No os 
preocupéis, porque no necesitariais crear una lista y anadir uno a uno 
los numeros del 30 al 50. Python proporciona una funcion llamada 
range (rango) que permite generar una lista que vaya desde el primer 
numero que le indiquemos al segundo. Lo veremos después de ver al 
fin a qué se refiere ese término tan recurrente: las funciones. 
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Una funcion es un fragmento de codigo con un nombre asociado que 
realiza una serie de tareas y devuelve un valor. A los fragmentos de 
codigo que tienen un nombre asociado y no devuelven valores se les 
suele llamar procedimientos. En Python no existen los procedimien- 
tos, ya que cuando el programador no especifica un valor de retorno la 
funcion devuelve el valor None (nada), equivalente al nu 11 de Java. 

Ademås de ayudarnos a programar y depurar dividiendo el programa 
en partes las funciones también permiten reutilizar codigo. 

En Python las funciones se declaran de la siguiente forma: 

def mi_funcion(param1, param2): 
print paraml 
print param2 

Es decir, la palabra clave def seguida del nombre de la funcion y entre 
paréntesis los argumentos separados por comas. A continuacion, en 
otra linea, indentado y después de los dos puntos tendriamos las lineas 
de codigo que conforman el codigo a ejecutar por la funcion. 

También podemos encontrarnos con una cadena de texto como 
primera linea del cuerpo de la funcion. Estas cadenas se conocen con 
el nombre de docstring (cadena de documentacion) y sirven, como su 
nombre indica, a modo de documentacion de la funcion. 

def mi_funcion(param1, param2): 

"""Esta funcion imprime los dos valores pasados 
como parametros""" 
print paraml 
print param2 

Esto es lo que imprime el opeardor ? de iPython o la funcion help 
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del lenguaje para proporcionar una ayuda sobre el uso y utilidad de 
las funciones. Todos los objetos pueden tener docstrings, no solo las 
funciones, como veremos mås adelante. 

Volviendo a la declaracion de funciones, es importante aclarar que 
al declarar la funcion lo unico que hacemos es asociar un nombre al 
fragmento de codigo que conforma la funcion, de forma que podamos 
ejecutar dicho codigo mås tarde referenciåndolo por su nombre. Es 
decir, a la hora de escribir estas lineas no se ejecuta la funcion. Para 
llamar a la funcion (ejecutar su codigo) se escribiria: 

mi_funcion("hola", 2) 

Es decir, el nombre de la funcion a la que queremos llamar seguido de 
los valores que queramos pasar como paråmetros entre paréntesis. La 
asociacion de los paråmetros y los valores pasados a la funcion se hace 
normalmente de izquierda a derecha: como a paraml le hemos dado un 
valor "hola" y param2 vale 2, mi_f uncion imprimiria hola en una linea, 
y a continuacion 2. 

Sin embargo también es posible modificar el orden de los paråmetros 
si indicamos el nombre del paråmetro al que asociar el valor a la hora 
de llamar a la funcion: 

mi_funcion(param2 = 2, paraml = "hola") 

El numero de valores que se pasan como paråmetro al llamar a la fun¬ 
cion tiene que coincidir con el numero de paråmetros que la funcion 
acepta segun la declaracion de la funcion. En caso contrario Python se 
quejarå: 

>» mi_funcion("hola") 

Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 

TypeError: mi_funcion() takes exactly 2 arguments (1 given) 

También es posible, no obstante, definir funciones con un numero va¬ 
riable de argumentos, o bien asignar valores por defecto a los paråme¬ 
tros para el caso de que no se indique ningun valor para ese paråmetro 
al llamar a la funcion. 
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Los valores por defecto para los paråmetros se definen situando un 
signo igual después del nombre del paråmetro y a continuacion el valor 
por defecto: 

def imprimir(texto, veces = 1): 
print veces * texto 


En el ejemplo anterior si no indicamos un valor para el segundo 
paråmetro se imprimirå una sola vez la cadena que le pasamos como 
primer paråmetro: 

»> imprimir( "hola") 
hola 


si se le indica otro valor, serå este el que se utilice: 

>» imprimir("hola", 2) 
holahola 


Para definir funciones con un numero variable de argumentos coloca- 
mos un ultimo paråmetro para la funcion cuyo nombre debe preceder- 
se de un signo *: 

def varios(param1, param2, *otros): 
for val in otros: 
print val 

varios(1, 2) 
varios(1, 2, 3) 
varios(1, 2, 3, 4) 


Esta sintaxis funciona creando una tupla (de nombre otros en el 
ejemplo) en la que se almacenan los valores de todos los paråmetros 
extra pasados como argumento. Para la primera llamada, var ios (1, 2), 
la tupla otros estaria vacia dado que no se han pasado mås paråmetros 
que los dos definidos por defecto, por lo tanto no se imprimiria nada. 
En la segunda llamada otros valdria (3, ), y en la tercera (3, 4). 


También se puede preceder el nombre del ultimo paråmetro con **, en 
cuyo caso en lugar de una tupla se utilizaria un diccionario. Las claves 
de este diccionario serian los nombres de los paråmetros indicados al 
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llamar a la funcion y los valores del diccionario, los valores asociados a 
estos paråmetros. 

En el siguiente ejemplo se utiliza la funcion items de los diccionarios, 
que devuelve una lista con sus elementos, para imprimir los paråmetros 
que contiene el diccionario. 

def varios(param1, param2, **otros): 
for i in otros.items(): 
print i 

varios(1, 2, tercero = 3) 

Los que conozcåis aigun otro lenguaje de programacion os estaréis 
preguntando si en Python al pasar una variable como argumento de 
una funcion estas se pasan por referencia o por valor. En el paso por 
referenda lo que se pasa como argumento es una referencia o puntero 
a la variable, es decir, la direccion de memoria en la que se encuentra el 
contenido de la variable, y no el contenido en si. En el paso por valor, 
por el contrario, lo que se pasa como argumento es el valor que conte- 
nia la variable. 

La diferencia entre ambos estriba en que en el paso por valor los 
cambios que se hagan sobre el paråmetro no se ven fuera de la fun¬ 
cion, dado que los argumentos de la funcion son variables locales a la 
funcion que contienen los valores indicados por las variables que se 
pasaron como argumento. Es decir, en realidad lo que se le pasa a la 
funcion son copias de los valores y no las variables en si. 

Si quisiéramos modificar el valor de uno de los argumentos y que estos 
cambios se reflejaran fuera de la funcion tendriamos que pasar el parå¬ 
metro por referencia. 

En C los argumentos de las funciones se pasan por valor, aunque se 
puede simular el paso por referencia usando punteros. En Java también 
se usa paso por valor, aunque para las variables que son objetos lo que 
se hace es pasar por valor la referencia al objeto, por lo que en realidad 
parece paso por referencia. 

En Python también se utiliza el paso por valor de referendas a objetos, 
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como en Java, aunque en el caso de Python, a diferencia de Java, todo 
es un objeto (para ser exactos lo que ocurre en realidad es que al objeto 
se le asigna otra etiqueta o nombre en el espacio de nombres local de la 
funcion). 

Sin embargo no todos los cambios que hagamos a los paråmetros 
dentro de una funcion Python se reflejarån fuera de esta, ya que hay 
que tener en cuenta que en Python existen objetos inmutables, como 
las tuplas, por lo que si intentåramos modificar una tupla pasada como 
paråmetro lo que ocurriria en realidad es que se crearia una nueva ins- 
tancia, por lo que los cambios no se verian fuera de la funcion. 

Veamos un pequeno programa para demostrarlo. En este ejemplo 
se hace uso del método append de las listas. Un método no es mås 
que una funcion que pertenece a un objeto, en este caso a una lista; y 
append, en concreto, sirve para anadir un elemento a una lista. 

def f(x, y): 
x = x + 3 
y.append(23) 
print x, y 

x = 22 
Y = [22] 
f(x, y) 
print x, y 

El resultado de la ejecucion de este programa seria 

25 [22, 23] 

22 [22, 23] 

Como vemos la variable x no conserva los cambios una vez salimos de 
la funcion porque los enteros son inmutables en Python. Sin embargo 
la variable y si los conserva, porque las listas son mutables. 

En resumen: los valores mutables se comportan como paso por refe¬ 
renda, y los inmutables como paso por valor. 

Con esto terminamos todo lo relacionado con los paråmetros de las 
funciones. Veamos por ultimo como devolver valores, para lo que se 
utiliza la palabra clave return: 


40 



Funciones 


def sumar(x, y): 
return x + y 

print sumar(3, 2) 

Como vemos esta funcion tan sencilla no hace otra cosa que sumar los 
valores pasados como paråmetro y devolver el resultado como valor de 
retorno. 

También podriamos pasar varios valores que retornar a return. 

def f(x, y): 

return x * 2, y * 2 

a, b = f(1, 2) 

Sin embargo esto no quiere decir que las funciones Python puedan de¬ 
volver varios valores, lo que ocurre en realidad es que Python crea una 
tupla al vuelo cuyos elementos son los valores a retornar, y esta unica 
variable es la que se devuelve. 
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En el capftulo de introduccion ya comentåbamos que Python es un 
lenguaje multiparadigma en el se podia trabajar con programacion es- 
tructurada, como vemamos haciendo hasta ahora, o con programacion 
orientada a objetos o programacion funcional. 

La Programacion Orientada a Objetos (POO u OOP segun sus siglas 
en inglés) es un paradigma de programacion en el que los conceptos 
del mundo real relevantes para nuestro problema se modelan a través 
de clases y objetos, y en el que nuestro programa consiste en una serie 
de interacciones entre estos objetos. 

Clases y objetos 

Para entender este paradigma primero tenemos que comprender qué es 
una clase y qué es un objeto. Un objeto es una entidad que agrupa un 
estado y una funcionalidad relacionadas. El estado del objeto se define 
a través de variables llamadas atributos, mientras que la funcionalidad 
se modela a través de funciones a las que se les conoce con el nombre 
de métodos del objeto. 

Un ejemplo de objeto podria ser un coche, en el que tendriamos atri¬ 
butos como la marca, el numero de puertas o el tipo de carburante y 
métodos como arrancar y parar. O bien cualquier otra combinacion de 
atributos y métodos segun lo que fuera relevante para nuestro progra¬ 
ma. 


Una clase, por otro lado, no es mås que una plantilla genérica a partir 
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de la cuål instanciar los objetos; plantilla que es la que define qué atri- 
butos y métodos tendrån los objetos de esa clase. 

Volviendo a nuestro ejemplo: en el mundo real existe un conjunto de 
objetos a los que llamamos coches y que tienen un conjunto de atribu- 
tos comunes y un comportamiento comun, esto es a lo que llamamos 
clase. Sin embargo, mi coche no es igual que el coche de mi vecino, y 
aunque pertenecen a la misma clase de objetos, son objetos distintos. 


En Python las clases se definen mediante la palabra clave class segui- 
da del nombre de la clase, dos puntos (:) y a continuacion, indentado, 
el cuerpo de la clase. Como en el caso de las funciones, si la primera 
linea del cuerpo se trata de una cadena de texto, esta serå la cadena de 
documentacion de la clase o docstring. 

class Coche: 

"""Abstraccion de los objetos coche.""" 

def _init_(se1f, gasolina): 

self.gasolina = gasolina 

print "Tenemos", gasolina, "litros" 

def arrancar(self): 

if self.gasolina > 0: 

print "Arranca" 
else: 

print "No arranca" 

def conducir(self): 

if self.gasolina > 0: 

self.gasolina -= 1 

print "Quedan", self.gasolina, "litros" 
else: 

print "No se mueve" 


Lo primero que llama la atencion en el ejemplo anterior es el nombre 

tan curioso que tiene el método_ init _. Este nombre es una conven- 

cion y no un capricho. El método_ init _, con una doble barra baja al 

principio y final del nombre, se ejecuta justo después de crear un nuevo 
objeto a partir de la clase, proceso que se conoce con el nombre de 

instanciacion. El método_ init _sirve, como sugiere su nombre, para 

realizar cualquier proceso de inicializacion que sea necesario. 

Como vemos el primer paråmetro de_ init _y del resto de métodos 
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de la clase es siempre self. Esta es una idea inspirada en Modula-3 y 
sirve para referirse al objeto actual. Este mecanismo es necesario para 
poder acceder a los atributos y métodos del objeto diferenciando, por 
ejemplo, una variable local mi_var de un atributo del objeto self . 
mi_var. 

Si volvemos al método_ini t_de nuestra clase Coche veremos como 

se utiliza self para asignar al atributo gasolina del objeto (self . gaso¬ 
lina) el valor que el programador especifico para el paråmetro gasoli - 
na. El paråmetro gasolina se destruye al final de la funcion, mientras 
que el atributo gasolina se conserva (y puede ser accedido) mientras el 
objeto viva. 

Para crear un objeto se escribirfa el nombre de la clase seguido de cual- 
quier paråmetro que sea necesario entre paréntesis. Estos paråmetros 

son los que se pasarån al método i nit , que como decfamos es el 

método que se llama al instanciar la clase. 

mi_coche = Coche(3) 

Os preguntareis entonces como es posible que a la hora de crear nues- 

tro primer objeto pasemos un solo paråmetro a_init_, el numero 

3, cuando la definicion de la funcion indica claramente que precisa de 
dos paråmetros (self y gasolina). Esto es asf porque Python pasa el 
primer argumento (la referenda al objeto que se crea) automågicamen- 
te. 

Ahora que ya hemos creado nuestro objeto, podemos acceder a sus 
atributos y métodos mediante la sintaxis objeto. atributo y objeto. 
metodo(): 

»> print mi_coche.gasolina 
3 

»> mi_coche. arrancar() 

Arranca 

»> mi_coche. conducir() 

Quedan 2 litros 
»> mi_coche. conducir() 

Quedan 1 litros 
»> mi_coche. conducir() 

Quedan 0 litros 
»> mi_coche. conducir() 
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No se mueve 

»> mi_coche. arrancar() 

No arranca 

»> print mi_coche.gasolina 
0 


Como ultimo apunte recordar que en Python, como ya se comento 
en repetidas ocasiones anteriormente, todo son objetos. Las cadenas, 
por ejemplo, tienen métodos como upper( ), que devuelve el texto en 
mayusculas o count (sub), que devuelve el numero de veces que se 
encontro la cadena sub en el texto. 


Herencia 

Hay tres conceptos que son båsicos para cualquier lenguaje de pro- 
gramacion orientado a objetos: el encapsulamiento, la herencia y el 
polimorfismo. 

En un lenguaje orientado a objetos cuando hacemos que una clase 
(subclase) herede de otra clase (superclase) estamos haciendo que la 
subclase contenga todos los atributos y métodos que tema la supercla¬ 
se. No obstante al acto de heredar de una clase también se le llama a 
menudo “extender una clase”. 

Supongamos que queremos modelar los instrumentos musicales de 
una banda, tendremos entonces una clase Guitarra, una clase Bateria, 
una clase Ba jo, etc. Cada una de estas clases tendrå una serie de atribu¬ 
tos y métodos, pero ocurre que, por el mero hecho de ser instrumentos 
musicales, estas clases compartirån muchos de sus atributos y métodos; 
un ejemplo seria el método tocar(). 

Es mås sencillo crear un tipo de objeto Instrumento con las atributos y 
métodos comunes e indicar al programa que Guitarra, Bateria y Bajo 
son tipos de instrumentos, haciendo que hereden de Instrumento. 

Para indicar que una clase hereda de otra se coloca el nombre de la cla¬ 
se de la que se hereda entre paréntesis después del nombre de la clase: 

class Instrumento: 

def_init_(se 1f, precio): 
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self.precio = precio 

def tocar(self): 

print "Estamos tocando musica" 

def romper(self): 

print "Eso lo pagas tu" 
print "Son", self.precio, "$$$" 

class Bateria(Instrumento): 
pass 

class Guitarra(Instrumento): 
pass 

Como BateriayGuitarra heredan de Instrumento, ambos tienen un 
método tocar( ) y un método romper (),y se inicializan pasando un 
paråmetro precio. Pero, ^qué ocurriria si quisiéramos especificar un 
nuevo paråmetro tipo_cuerda a la hora de crear un objeto Guitarra? 

Bastaria con escribir un nuevo método_ init _para la clase Guitarra 

que se ejecutaria en lugar del_ init _de Instrumento. Esto es lo que 

se conoce como sobreescribir métodos. 

Ahora bien, puede ocurrir en algunos casos que necesitemos sobrees¬ 
cribir un método de la clase padre, pero que en ese método queramos 
ejecutar el método de la clase padre porque nuestro nuevo método no 
necesite mås que ejecutar un par de nuevas instrucciones extra. En ese 
caso usariamos la sintaxis SuperClase .metodo(self , args) parallamar 
al método de igual nombre de la clase padre. Por ejemplo, para llamar 

al método_ init _de I ns t rumen to desde Guitarra usariamos Instru¬ 
mento._init_(self, precio) 

Observad que en este caso si es necesario especificar el paråmetro self. 

Herencia multiple 

En Python, a diferencia de otros lenguajes como Java o C#, se permite 
la herencia multiple, es decir, una clase puede heredar de varias clases a 
la vez. Por ejemplo, podriamos tener una clase Cocodr i lo que heredara 
de la clase Terrestre, con métodos como caminar () y atributos como 
velocidad_caminar y de la clase Acuatico, con métodos como nadar() 
y atributos como velocidad_nadar. Basta con enumerar las clases de 
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las que se hereda separåndolas por comas: 

class Cocodrilo(Terrestre, Acuatico): 
pass 

En el caso de que alguna de las clases padre tuvieran métodos con el 
mismo nombre y numero de paråmetros las clases sobreescribirfan la 
implementacion de los métodos de las clases mås a su derecha en la 
definicion. 

En el siguiente ejemplo, como Terrestre se encuentra mås a la iz- 
quierda, serfa la definicion dedesplazarde esta clase la que prevale- 
cerfa,y por lo tanto si llamamos al método desplazar de un objeto de 
tipo Cocodrilo lo que se imprimina serfa “El animal anda”. 

class Terrestre: 

def desplazar(self): 

print "El animal anda" 

class Acuatico: 

def desplazar(self): 

print "El animal nada" 

class Cocodrilo(Terrestre, Acuatico): 
pass 

c = Cocodrilo() 
c.desplazar() 

Polimorfismo 

La palabra polimorfismo, del griego poly morphos (varias formas), se re¬ 
dere a la habilidad de objetos de distintas clases de responder al mismo 
mensaje. Esto se puede conseguir a través de la herencia: un objeto de 
una clase derivada es al mismo tiempo un objeto de la clase padre, de 
forma que allf donde se requiere un objeto de la clase padre también se 
puede utilizar uno de la clase hija. 

Python, al ser de tipado dinåmico, no impone restricciones a los tipos 
que se le pueden pasar a una funcion, por ejemplo, mås allå de que el 
objeto se comporte como se espera: si se va a llamar a un método f () 
del objeto pasado como paråmetro, por ejemplo, evidentemente el 
objeto tendrå que contar con ese método. Por ese motivo, a diferencia 
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de lenguajes de tipado eståtico como Java o C++, el polimorfismo en 
Python no es de gran importancia. 

En ocasiones también se utiliza el término polimorfismo para referirse 
a la sobrecarga de métodos, término que se define como la capacidad 
del lenguaje de determinar qué método ejecutar de entre varios méto¬ 
dos con igual nombre segun el tipo o numero de los paråmetros que se 
le pasa. En Python no existe sobrecarga de métodos (el ultimo método 
sobreescribirfa la implementacion de los anteriores), aunque se puede 
conseguir un comportamiento similar recurriendo a funciones con va- 
lores por defecto para los paråmetros o a la sintaxis *params o **params 
explicada en el capftulo sobre las funciones en Python, o bien usando 
decoradores (mecanismo que veremos mås adelante). 

Encapsulacion 

La encapsulacion se refiere a impedir el acceso a determinados mé¬ 
todos y atributos de los objetos estableciendo asf qué puede utilizarse 
desde fuera de la clase. 

Esto se consigue en otros lenguajes de programacion como Java utili- 
zando modificadores de acceso que definen si cualquiera puede acceder 
a esa funcion o variable (public) o si estå restringido el acceso a la 
propia clase (private). 

En Python no existen los modificadores de acceso, y lo que se suele 
hacer es que el acceso a una variable o funcion viene determinado por 
su nombre: si el nombre comienza con dos guiones bajos (y no termina 
también con dos guiones baj os) se trata de una variable o funcion pri- 
vada, en caso contrario es publica. Los métodos cuyo nombre comien¬ 
za y termina con dos guiones baj os son métodos especiales que Python 
llama automåticamente bajo ciertas circunstancias, como veremos al 
final del capftulo. 

En el siguiente ejemplo solo se imprimirå la cadena correspondiente al 

método pub li co (), mientras que al intentar llamar al método_pr i - 

vado( ) Python lanzarå una excepcion quejåndose de que no existe 
(evidentemente existe, pero no lo podemos ver porque es privado). 
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class Ejemplo: 

def publico(self): 
print "Publico" 

def _privado(self): 

print "Privado" 

ej = Ejemplo() 
ej .publico() 
ej._privado() 


Este mecanismo se basa en que los nombres que comienzan con un 
doble guion bajo se renombran para incluir el nombre de la clase 
(caracteristica que se conoce con el nombre de name mangling). Esto 
implica que el método o atributo no es realmente privado, y podemos 
acceder a él mediante una pequena trampa: 

ej._Ejemplo_privado() 


En ocasiones también puede suceder que queramos permitir el acceso 
a aigun atributo de nuestro objeto, pero que este se produzca de forma 
controlada. Para esto podemos escribir métodos cuyo unico cometido 
sea este, métodos que normalmente, por convencion, tienen nombres 
como getVariable y setVariable; de ahi que se conozcan también con 
el nombre de getters y setters. 

class Fecha(): 

def _init_(self): 

self._dia = 1 

def getDia(self): 

return self._dia 

def setDia(self, dia): 

if dia > 0 and dia < 31: 

self._dia = dia 

else: 

print "Error" 

mi_fecha = Fecha() 
mi_fecha.setDia(33) 


Esto se podria simplificar mediante propiedades, que abstraen al usua- 
rio del hecho de que se estå utilizando métodos entre bambalinas para 
obtener y modificar los valores del atributo: 
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class Fecha(object): 

def _init_(self): 

self._dia = 1 

def getDia(self): 

return self._dia 

def setDia(self, dia): 

if dia > 0 and dia < 31: 

self._dia = dia 

else: 

print "Error" 

dia = property(getDia, setDia) 

mi_fecha = Fecha() 
mi_fecha.dia = 33 


Clases de “nuevo-estilo” 

En el ejemplo anterior os habrå llamado la atencion el hecho de que la 
clase Fecha derive de ob ject. La razon de esto es que para poder usar 
propiedades la clase tiene que ser de “nuevo-estilo”, clases enriquecidas 
introducidas en Python 2.2 que serån el eståndar en Python 3.0 pero 
que aun conviven con las clases “clåsicas” por razones de retrocompa- 
tibilidad. Ademås de las propiedades las clases de nuevo estilo anaden 
otras funcionalidades como descriptores o métodos eståticos. 


Para que una clase sea de nuevo estilo es necesario, por ahora, que 
extienda una clase de nuevo-estilo. En el caso de que no sea necesa¬ 
rio heredar el comportamiento o el estado de ninguna clase, como en 
nuestro ejemplo anterior, se puede heredar de ob ject, que es un objeto 
vacio que sirve como base para todas las clases de nuevo estilo. 


La diferencia principal entre las clases antiguas y las de nuevo estilo 
consiste en que a la hora de crear una nueva clase anteriormente no se 
definia realmente un nuevo tipo, sino que todos los objetos creados a 
partir de clases, fueran estas las clases que fueran, eran de tipo instan- 
ce. 


Métodos especiales 
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Ya vimos al principio del articulo el uso del método_in i t_. Exis- 

ten otros métodos con significados especiales, cuyos nombres siempre 
comienzan y terminan con dos guiones bajos. A continuacion se listan 
algunos especialmente utiles. 

_init_ (self, args) 

Método llamado después de crear el objeto para realizar tareas de 
inicializacion. 

_new_ (cis, args) 

Método exclusivo de las clases de nuevo estilo que se ejecuta antes que 

_ init _y que se encarga de construir y devolver el objeto en si. Es 

equivalente a los constructores de C++ o Java. Se trata de un método 
eståtico, es decir, que existe con independencia de las instancias de 
la clase: es un método de clase, no de objeto, y por lo tanto el primer 
paråmetro no es self, sino la propia clase: cis. 

_del_(self) 

Método llamado cuando el objeto va a ser borrado. También llamado 
destructor, se utiliza para realizar tareas de limpieza. 

_str_ (self) 

Método llamado para crear una cadena de texto que represente a nues- 
tro objeto. Se utiliza cuando usamos print para mostrar nuestro objeto 
o cuando usamos la funcion str(ob j) para crear una cadena a partir de 
nuestro objeto. 

_cmp_ (self, otro) 

Método llamado cuando se utilizan los operadores de comparacion 
para comprobar si nuestro objeto es menor, mayor o igual al objeto 
pasado como paråmetro. Debe devolver un numero negativo si nuestro 
objeto es menor, cero si son iguales, y un numero positivo si nuestro 
objeto es mayor. Si este método no estå definido y se intenta com- 
parar el objeto mediante los operadores <, <=, > o >= se lanzarå una 
excepcion. Si se utilizan los operadores == o ! = para comprobar si dos 
objetos son iguales, se comprueba si son el mismo objeto (si tienen el 
mismo id). 

_len_ (self) 

Método llamado para comprobar la longitud del objeto. Se utiliza, por 
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ejemplo, cuando se llama a la funcion len(ob j) sobre nuestro objeto. 
Como es de suponer, el método debe devolver la longitud del objeto. 


Existen bastantes mås métodos especiales, que permite entre otras 
cosas utilizar el mecanismo de slicing sobre nuestro objeto, utilizar 
los operadores aritméticos o usar la sintaxis de diccionarios, pero un 
estudio exhaustivo de todos los métodos queda fuera del proposito del 
capftulo. 
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OBJETOS 


En los capitulos dedicados a los tipos simples y las colecciones veiamos 
por primera vez algunos de los objetos del lenguaje Python: numeros, 
booleanos, cadenas de texto, diccionarios, listas y tuplas. 

Ahora que sabemos qué son las clases, los objetos, las funciones, y los 
métodos es el momento de revisitar estos objetos para descubrir su 
verdadero potencial. 

Veremos a continuacion algunos métodos utiles de estos objetos. Evi- 
dentemente, no es necesario memorizarlos, pero si, al menos, recordar 
que existen para cuando sean necesarios. 

Diccionarios 

D■get(k[, d]) 

Busca el valor de la clave k en el diccionario. Es equivalente a utilizar 
D [ k ] pero al utilizar este método podemos indicar un valor a devolver 
por defecto si no se encuentra la clave, mientras que con la sintaxis 
D [ k ], de no existir la clave se lanzaria una excepcion. 

D.has_key(k) 

Comprueba si el diccionario tiene la clave k. Es equivalente a la sin¬ 
taxis k in D. 

D.items() 

Devuelve una lista de tuplas con pares clave-valor. 
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D.keys() 

Devuelve una lista de las claves del diccionario. 

D■pop(k[, d]) 

Borra la clave k del diccionario y devuelve su valor. Si no se encuentra 
dicha clave se devuelve d si se especifico el paråmetro o bien se lanza 
una excepcion. 

D.values() 

Devuelve una lista de los valores del diccionario. 


Cadenas 

S.count(sub[, start[, end]]) 

Devuelve el numero de veces que se encuentra sub en la cadena. Los 
paråmetros opcionales startyend definen una subcadena en la que 
buscar. 

S.find(sub[, start[, end]]) 

Devuelve la posicion en la que se encontro por primera vez sub en la 
cadena o -1 si no se encontro. 

S.join(sequence) 

Devuelve una cadena resultante de concatenar las cadenas de la se- 
cuencia seq separadas por la cadena sobre la que se llama el método. 

S.partition(sep) 

Busca el separador s ep en la cadena y devuelve una tupla con la sub¬ 
cadena hasta dicho separador, el separador en si, y la subcadena del 
separador hasta el final de la cadena. Si no se encuentra el separador, la 
tupla contendrå la cadena en si y dos cadenas vacfas. 

S.replace(old, new[, count]) 

Devuelve una cadena en la que se han reemplazado todas las ocurren- 
cias de la cadena old por la cadena new. Si se especifica el paråmetro 
count, este indica el numero måximo de ocurrencias a reemplazar. 

S.split([sep [,maxsplit] ]) 

Devuelve una lista conteniendo las subcadenas en las que se divide 
nuestra cadena al dividirlas por el delimitador s ep. En el caso de que 
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no se especifique sep, se usan espacios. Si se especifica maxsplit, este 
indica el numero måximo de particiones a realizar. 

Listas 

L. append(object) 

Anade un objeto al final de la lista. 

L.count(value) 

Devuelve el numero de veces que se encontro value en la lista. 

L.extend(iterable) 

Anade los elementos del iterable a la lista. 

L.index(value[, start[, stop]]) 

Devuelve la posicion en la que se encontro la primera ocurrencia de 
value. Si se especifican, start y stop definen las posiciones de inicio y 
fin de una sublista en la que buscar. 

L.insert(index, object) 

Inserta el objeto object en la posicion index. 

L.pop([index]) 

Devuelve el valor en la posicion index y lo elimina de la lista. Si no se 
especifica la posicion, se utiliza el ultimo elemento de la lista. 

L.remove(value) 

Eliminar la primera ocurrencia de value en la lista. 

L.reverse() 

Invierte la lista. Esta funcion trabaja sobre la propia lista desde la que 
se invoca el método, no sobre una copia. 

L.sort(cmp=None, key=None, reverse=False) 

Ordena la lista. Si se especifica cmp, este debe ser una funcion que tome 
como paråmetro dos valores x e y de la lista y devuelva -1 si x es menor 
que y, 0 si son iguales y 1 si x es mayor que y. 

El paråmetro reverse es un booleano que indica si se debe ordenar 
la lista de forma inversa, lo que serfa equivalente a llamar primero a 
L. sort () y después a L. reverse (). 
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Por ultimo, si se especifica, el paråmetro key debe ser una funcion que 
tome un elemento de la lista y devuelva una clave a utilizar a la hora de 
comparar, en lugar del elemento en si. 
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FUNCIONAL 


La programacion funcional es un paradigma en el que la programa¬ 
cion se basa casi en su totalidad en funciones, entendiendo el concepto 
de funcion segun su definition matemåtica, y no como los simples 
subprogramas de los lenguajes imperativos que hemos visto hasta 
ahora. 

En los lenguajes funcionales puros un programa consiste exclusiva- 
mente en la aplicacion de distintas funciones a un valor de entrada 
para obtener un valor de salida. 

Python, sin ser un lenguaje puramente funcional incluye varias caracte- 
risticas tomadas de los lenguajes funcionales como son las funciones de 
orden superior o las funciones lambda (funciones anonimas). 

Funciones de orden superior 

El concepto de funciones de orden superior se refiere al uso de fun¬ 
ciones como si de un valor cualquiera se tratara, posibilitando el pasar 
funciones como paråmetros de otras funciones o devolver funciones 
como valor de retorno. 

Esto es posible porque, como hemos insistido ya en varias ocasiones, 
en Python todo son objetos. Y las funciones no son una excepcion. 

Veamos un pequeno ejemplo 

def saludar(lang): 
def saludar_es(): 


57 


Python para todos 


print "Hola" 

def saludar_en(): 
print "Hi" 

def saludar_fr(): 
print "Salut" 


lang_func 


" f r' 


saludar_es, 
saludar_en, 
saludar_fr 


return lang_func[lang] 

f = saludar("es") 
f() 


Como podemos observar lo primero que hacemos en nuestro pequeno 
programa es llamar a la funcion saludar con un paråmetro "es". En la 
funcion saludar se definen varias funciones: saludar_es, saludar_en y 
saludar_f r y a continuacion se crea un diccionario que tiene como cla- 
ves cadenas de texto que identifican a cada lenguaje, y como valores las 
funciones. El valor de retorno de la funcion es una de estas funciones. 
La funcion a devolver viene determinada por el valor del paråmetro 
lang que se paso como argumento de saludar. 

Como el valor de retorno de saludar es una funcion, como hemos 
visto, esto quiere decir que f es una variable que contiene una funcion. 
Podemos entonces llamar a la funcion a la que se redere f de la forma 
en que llamariamos a cualquier otra funcion, anadiendo unos parénte- 
sis y, de forma opcional, una serie de paråmetros entre los paréntesis. 

Esto se podria acortar, ya que no es necesario almacenar la funcion que 
nos pasan como valor de retorno en una variable para poder llamarla: 

»> saludar("en")() 

Hi 

»> saludar("fr")() 

Salut 


En este caso el primer par de paréntesis indica los paråmetros de la 
funcion saludar, y el segundo par, los de la funcion devuelta por salu¬ 
dar. 
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Iteraciones de orden superior so¬ 
bre listas 

Una de las cosas mås interesantes que podemos hacer con nuestras 
funciones de orden superior es pasarlas como argumentos de las fun- 
ciones map, filter y reduce. Estas funciones nos permiten sustituir los 
budes tipicos de los lenguajes imperativos mediante construcciones 
equivalentes. 

map(function, sequence[, sequence,...]) 

La funcion map aplica una funcion a cada elemento de una secuencia y 
devuelve una lista con el resultado de aplicar la funcion a cada elemen¬ 
to. Si se pasan como paråmetros n secuencias, la funcion tendrå que 
aceptar n argumentos. Si alguna de las secuencias es mås pequena que 
las demås, el valor que le llega a la funcion f unct ion para posiciones 
mayores que el tamano de dicha secuencia serå None. 

A continuacion podemos ver un ejemplo en el que se utiliza map para 
elevar al cuadrado todos los elementos de una lista: 

def cuadrado(n): 
return n ** 2 

1 = [L 2, 3] 

12 = map(cuadrado, 1) 

filter(funetion, sequence) 

La funcion filter verifica que los elementos de una secuencia eum- 
plan una determinada condicion, devolviendo una secuencia con los 
elementos que cumplen esa condicion. Es decir, para cada elemento de 
sequence se aplica la funcion f unction; si el resultado es True se anade 
a la lista y en caso contrario se descarta. 

A continuacion podemos ver un ejemplo en el que se utiliza filter 
para conservar solo los numeros que son pares. 

def es_par(n): 

return (n % 2.0 == 0) 

1 = [L 2, 3] 
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12 = filter(es_par, 1) 

reduce(function, sequence[, initial]) 

La funcion reduce aplica una funcion a pares de elementos de una 
secuencia hasta dej arla en un solo valor. 

A continuacion podemos ver un ejemplo en el que se utiliza reduce 
para sumar todos los elementos de una lista. 

def sumar(x, y): 
return x + y 

1 = [1, 2, 3] 

12 = reduce(sumar, 1) 

Funciones lambda 

El operador lambda sirve para crear funciones anonimas en linea. Al ser 
funciones anonimas, es decir, sin nombre, estas no podrån ser referen- 
ciadas mås tarde. 

Las funciones lambda se construyen mediante el operador lambda, los 
paråmetros de la funcion separados por comas (atencion, SIN parénte- 
sis), dos puntos (:) y el codigo de la funcion. 

Esta construccion podrian håber sido de utilidad en los ejemplos an- 
teriores para reducir codigo. El programa que utilizamos para explicar 
filter, por ejemplo, podria expresarse asi: 


1 = [L 2, 3] 

12 = filter(lambda n: n % 2.0 == 0, 1) 


Comparemoslo con la version anterior: 


def es_par(n): 

return (n % 2.0 == 0) 

1 = [1, 2, 3] 

12 = filter(es_par, 1) 


Las funciones lambda estån restringidas por la sintaxis a una sola 
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expresion. 

Comprension de listas 

En Python 3000 map, f i 1 ter y reduce perderån importancia. Y aun- 
que estas funciones se mantendrån, reduce pasarå a formar parte del 
modulo functools, con lo que quedarå fuera de las funciones dispo¬ 
nibles por defecto, ymapyfilter se desaconsejarån en favor de las list 
comprehensions o comprension de listas. 

La comprension de listas es una caracteristica tomada del lenguaje de 
programacion funcional Haskell que estå presente en Python desde la 
version 2.0 y consiste en una construccion que permite crear listas a 
partir de otras listas. 

Cada una de estas construcciones consta de una expresion que deter¬ 
mina como modificar el elemento de la lista original, seguida de una o 
varias clausulas for y opcionalmente una o varias clausulas if. 

Veamos un ejemplo de como se podria utilizar la comprension de listas 
para elevar al cuadrado todos los elementos de una lista, como hicimos 
en nuestro ejemplo de map. 

12 = [n ** 2 for n in l] 

Esta expresion se leeria como “para cada n en 1 haz n ** 2”. Como 
vemos tenemos primero la expresion que modifica los valores de la lista 
original (n ** 2), después el for, el nombre que vamos a utilizar para 
referirnos al elemento actual de la lista original, el in, y la lista sobre la 
que se itera. 

El ejemplo que utilizamos para la funcion f ilter (conservar solo los 
numeros que son pares) se podria expresar con comprension de listas 
asi: 


12 = [n for n in 1 if n % 2.0 == 0] 


Veamos por ultimo un ejemplo de compresion de listas con varias 
clausulas for: 
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1 = [®, 1, 2, 3] 
m = [ a , b J 
n = [s * v for s in m 
for v in 1 
if v > 0] 


Esta construccion seria equivalente a una serie de for-in anidados: 


1 = [0, 1, 2, 3] 
m = [ a , b J 

n = [] 

for s in m: 

for v in 1: 
if v > 0: 

n.append(s* v) 


Generadores 

Las expresiones generadoras funcionan de forma muy similar a la 
comprension de listas. De hecho su sintaxis es exactamente igual, a 
excepcion de que se utilizan paréntesis en lugar de corchetes: 


12 = (n ** 2 for n in l) 


Sin embargo las expresiones generadoras se diferencian de la compren¬ 
sion de listas en que no se devuelve una lista, sino un generador. 


»> 12 = [n ** 2 for n in 1] 

>» 12 

rø i 4 9i 

»> 12 = (n ** 2 for n in 1) 

>» 12 

<generator object at ØxØØE33210> 


Un generador es una clase especial de funcion que genera valores sobre 
los que iterar. Para devolver el siguiente valor sobre el que iterar se 
utiliza la palabra clave yield en lugar de return. Veamos por ejemplo 
un generador que devuelva numeros de n a m con un salto s. 

def mi_generador(n, m, s): 
while(n <= m): 
yield n 
n += s 
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»> x = mi_generador(0, 5, 1) 

»> x 

<generator object at ØxØØE25710> 

El generador se puede utilizar en cualquier lugar donde se necesite un 
objeto iterable. Por ejemplo en un for-in: 

for n in mi_generador(0, 5, 1): 
print n 

Como no estamos creando una lista completa en memoria, sino gene- 
rando un solo valor cada vez que se necesita, en situaciones en las que 
no sea necesario tener la lista completa el uso de generadores puede 
suponer una gran diferencia de memoria. En todo caso siempre es po- 
sible crear una lista a partir de un generador mediante la funcion list: 

lista = list(mi_generador) 


Decoradores 

Un decorador no es es mas que una funcion que recibe una funcion 
como paråmetro y devuelve otra funcion como resultado. Por ejem¬ 
plo podriamos querer anadir la funcionalidad de que se imprimiera el 
nombre de la funcion llamada por motivos de depuracion: 

def mi_decorador(funcion): 
def nueva(*args): 

print "Llamada a la funcion", funcion._name_ 

retorno = funcion(*args) 
return retorno 
return nueva 


Como vemos el codigo de la funcion mi_decorador no hace mås que 
crear una nueva funcion y devolverla. Esta nueva funcion imprime el 
nombre de la funcion a la que “decoramos”, ejecuta el codigo de dicha 
funcion, y devuelve su valor de retorno. Es decir, que si llamåramos 
a la nueva funcion que nos devuelve mi_decorador, el resultado seria 
el mismo que el de llamar directamente a la funcion que le pasamos 
como paråmetro, exceptuando el que se imprimiria ademås el nombre 
de la funcion. 
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Supongamos como ejemplo una funcion imp que no hace otra cosa que 
mostrar en pantalla la cadena pasada como paråmetro. 

»> imp("hola") 
hola 

»> mi_decorador(imp)("hola") 

Llamada a la funcion imp 
hola 


La sintaxis para llamar a la funcion que nos devuelve mi_decorador no 
es muy clara, aunque si lo estudiamos detenidamente veremos que no 
tiene mayor complicacion. Primero se llama a la funcion que decora 
con la funcion a decorar: mi_decorador(imp); y una vez obtenida la 
funcion ya decorada se la puede llamar pasando el mismo paråmetro 
que se paso anteriormente: mi_decorador( imp) ("hola") 

Esto se podria expresar mås claramente precediendo la definicion de la 
funcion que queremos decorar con el signo @ seguido del nombre de la 
funcion decoradora: 

@mi_decorador 
def imp(s): 
print s 

De esta forma cada vez que se llame a imp se estarå llamando realmen¬ 
te a la version decorada. Python incorpora esta sintaxis desde la version 
2.4 en adelante. 


Si quisiéramos aplicar mås de un decorador bastaria anadir una nueva 
linea con el nuevo decorador. 

@otro_decorador 
@mi_decorador 
def imp(s): 
print s 


Es importante advertir que los decoradores se ejecutarån de abajo a 
arriba. Es decir, en este ejemplo primero se ejecutaria mi_decorador y 
después otro_decorador. 
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Las excepciones son errores detectados por Python durante la eje- 
cucion del programa. Cuando el intérprete se encuentra con una 
situacion excepcional, como el intentar dividir un numero entre 0 o 
el intentar acceder a un archivo que no existe, este genera o lanza una 
excepcion, informando al usuario de que existe aigun problema. 

Si la excepcion no se captura el flujo de ejecucion se interrumpe y se 
muestra la informacion asociada a la excepcion en la consola de forma 
que el programador pueda solucionar el problema. 

Veamos un pequeno programa que lanzaria una excepcion al intentar 
dividir 1 entre 0. 

def division(a, b): 
return a / b 

def calcular(): 
division(1, 0) 

calcular() 


Si lo ejecutamos obtendremos el siguiente mensaje de error: 

$ python ejemplo.py 

Traceback (most recent call last): 

File "ejemplo.py", line 7, in 
calcular() 

File "ejemplo.py", line 5, in calcular 
division(1, 0) 

File "ejemplo.py", line 2, in division 
a / b 

ZeroDivisionError: integer division or modulo by zero 


Lo primero que se muestra es el trazado de pila o traceback , que con- 
siste en una lista con las llamadas que provocaron la excepcion. Como 
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vemos en el trazado de pila, el error estuvo causado por la llamada a 
calcular( ) de la lmea 7, que a su vez llama a division( 1 , 0) en la 
lfnea 5 y en ultima instancia por la ejecucion de la sentencia a / b de 
la linea 2 de division. 

A continuacion vemos el tipo de la excepcion, ZeroDivisionError, 
junto a una descripcion del error: “integer division or modulo by zero” 
(modulo o division entera entre cero). 

En Python se utiliza una construccion try-except para capturar y 
tratar las excepciones. El bloque try (intentar) define el fragmento de 
codigo en el que creemos que podria producirse una excepcion. El blo¬ 
que exe ep t (excepcion) permite indicar el tratamiento que se llevarå a 
cabo de producirse dicha excepcion. Muchas veces nuestro tratamiento 
de la excepcion consistirå simplemente en imprimir un mensaje mås 
amigable para el usuario, otras veces nos interesarå registrar los errores 
y de vez en cuando podremos establecer una estrategia de resolucion 
del problema. 

En el siguiente ejemplo intentamos crear un objeto f de tipo fichero. 
De no existir el archivo pasado como paråmetro, se lanza una excep¬ 
cion de tipo IOError, que capturamos gracias a nuestro try-except. 

try: 

f = fi le("archivo.txt") 
except: 

print "El archivo no existe" 

Python permite utilizar varios except para un solo bloque try, de 
forma que podamos dar un tratamiento distinto a la excepcion de- 
pendiendo del tipo de excepcion de la que se trate. Esto es una buena 
pråctica, y es tan sencillo como indicar el nombre del tipo a continua¬ 
cion del except. 

try: 

num = int("3a") 
print no_existe 
except NameError: 

print "La variable no existe" 
except ValueError: 

print "El valor no es un numero" 
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Cuando se lanza una excepcion en el bloque try, se busca en cada una 
de las clausulas except un manejador adecuado para el tipo de error 
que se produjo. En caso de que no se encuentre, se propaga la excep¬ 
cion. 


Ademås podemos hacer que un mismo except sirva para tratar mås 
de una excepcion usando una tupla para listar los tipos de error que 
queremos que trate el bloque: 

try: 

num = int("3a") 
print no_existe 

except (NameError, ValueError): 
print "Ocurrio un error" 


La construccion try-except puede contar ademås con una clausula 
el se, que define un fragmento de codigo a ejecutar solo si no se ha 
producido ninguna excepcion en el try. 

try: 

num = 33 
except: 

print "Hubo un error!" 
else: 

print "Todo esta bien" 


También existe una clausula final ly que se ejecuta siempre, se pro- 
duzca o no una excepcion. Esta clausula se suele utilizar, entre otras 
cosas, para tareas de limpieza. 

try: 

z = x / y 

except ZeroDivisionError: 

print "Division por cero" 
finally: 

print "Limpiando" 


También es interesante comentar que como programadores podemos 
crear y lanzar nuestras propias excepciones. Basta crear una clase que 
herede de Except ion o cualquiera de sus hijas y lanzarla con raise. 

class MiError(Exception): 

def_init_(se 1f, valor): 

self.valor = valor 
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def _str_(self): 

return "Error " + str(self.valor) 

try: 

if resultado > 20: 
raise MiError(33) 
except MiError, e: 
print e 

Por ultimo, a continuacion se listan a modo de referencia las excepcio- 
nes disponibles por defecto, asi como la clase de la que deriva cada una 
de ellas entre paréntesis. 

BaseExcept ion: Clase de la que heredan todas las excepciones. 

Except ion (BaseExcept ion): Super clase de todas las excepciones que 
no sean de salida. 

GeneratorExit (Exception): Se pide que se salga de un generador. 

StandardError (Except ion): Clase base para todas las excepciones que 
no tengan que ver con salir del intérprete. 

Ari thmet icEr ror (StandardError ): Clase base para los errores aritmé- 
ticos. 

Floa tingPoint Er ror (Ar i thmet icError ): Error en una operacion de 
coma flotante. 

Overf lowError (Ari thmet icError ): Resultado demasiado grande para 
poder representarse. 

ZeroDivisionError(ArithmeticError): Lanzada cuando el segundo 
argumento de una operacion de division o modulo era 0. 

AssertionError(StandardError ): Fallo la condicion de un estamento 
assert. 

AttributeError(StandardError ): No se encontro el atributo. 
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EOFError(StandardError ): Se intento leer mås allå del final de fichero. 

EnvironmentError(StandardError): Clase padre de los errores relacio- 
nados con la entrada/salida. 

IOError(EnvironmentError): Error en una operacion de entrada/salida. 

OSError (Environmen t Error ): Error en una llamada a sistema. 

WindowsError(OSError): Error en una llamada a sistema en Windows. 

ImportError(StandardError): No se encuentra el modulo o el elemen¬ 
to del modulo que se queria importar. 

LookupError(StandardError): Clase padre de los errores de acceso. 

IndexError(LookupError): El indice de la secuencia estå fuera del 
rango posible. 

KeyError(LookupError): La clave no existe. 

MemoryError(StandardError ): No queda memoria suficiente. 

NameError(StandardError): No se encontro ningun elemento con ese 
nombre. 

UnboundLocalError(NameError): El nombre no estå asociado a ninguna 
variable. 

ReferenceError(StandardError): El objeto no tiene ninguna referen¬ 
da fuerte apuntando hacia él. 

RuntimeError(StandardError): Error en tiempo de ejecucion no espe- 
cificado. 

NotImplementedError(RuntimeError ): Ese método o funcion no estå 
implementado. 

SyntaxEr ror (StandardError): Clase padre para los errores sintåcticos. 
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IndentationError(SyntaxError ): Error en la indentacion del archivo. 

TabError( IndentationError ): Error debido a la mezcla de espacios y 
tabuladores. 

SystemError(StandardError ): Error interno del intérprete. 

TypeError(StandardError):Tipo de argumento no apropiado. 

ValueError(StandardError): Valor del argumento no apropiado. 

UnicodeError(ValueError): Clase padre para los errores relacionados 
con Unicode. 

UnicodeDecodeError(UnicodeError ): Error de decodificacion Unicode. 

UnicodeEncodeError(UnicodeError ): Error de codificacion Unicode. 

UnicodeTranslateError(UnicodeError): Error de traduccion Unicode. 

StopIteration(Exception): Se utiliza para indicar el final del iterador. 

Warning(Exception): Clase padre para los avisos. 

DeprecationWarning(Warning): Clase padre para avisos sobre caracte- 
risticas obsoletas. 

FutureWarning(Warning): Aviso. La semåntica de la construccion cam- 
biarå en un futuro. 

ImportWarning(Warning): Aviso sobre posibles errores a la hora de 
importar. 

PendingDeprecationWarning(Warning): Aviso sobre caracteristicas que 
se marcarån como obsoletas en un futuro proximo. 

Runt imeWarning(Warning): Aviso sobre comportmaientos dudosos en 
tiempo de ejecucion. 
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SyntaxWarning(Warning): Aviso sobre sintaxis dudosa. 

UnicodeWarning(Warning): Aviso sobre problemas relacionados con 
Unicode, sobre todo con problemas de conversion. 

UserWarning(Warning): Clase padre para avisos creados por el progra- 
mador. 

Keyboard I nterrupt (BaseExcept ion): El programa fué interrumpido 
por el usuario. 

SystemExit (BaseException): Peticion del intérprete para terminar la 
ejecucion. 
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Modulos 

Para facilitar el mantenimiento y la lectura los programas demasiado 
largos pueden dividirse en modulos, agrupando elementos relaciona- 
dos. Los modulos son entidades que permiten una organizacion y divi¬ 
sion logica de nuestro codigo. Los ficheros son su contrapartida fisica: 
cada archivo Python almacenado en disco equivale a un modulo. 

Vamos a crear nuestro primer modulo entonces creando un pequeno 
archivo modulo.py con el siguiente contenido: 

def mi_funcion(): 

print "una funcion" 

class MiClase: 

def _init_(self): 

print "una clase" 

print "un modulo" 

Si quisiéramos utilizar la funcionalidad definida en este modulo en 
nuestro programa tendriamos que importarlo. Para importar un mo¬ 
dulo se utiliza la palabra clave import seguida del nombre del modulo, 
que consiste en el nombre del archivo menos la extension. Como ejem- 
plo, creemos un archivo programa.py en el mismo directorio en el que 
guardamos el archivo del modulo (esto es importante, porque si no se 
encuentra en el mismo directorio Python no podrå encontrarlo), con el 
siguiente contenido: 

import modulo 
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modulo.mi_funcion() 

El import no solo hace que tengamos disponible todo lo definido 
dentro del modulo, sino que también ejecuta el codigo del modulo. Por 
esta razon nuestro programa, ademås de imprimir el texto “una fun- 
cion” al llamar a mi_f uncion, también imprimina el texto a un modulo”, 
debido al print del modulo importado. No se imprimina, no obstante, 
el texto “una clase”, ya que lo que se hizo en el modulo fue tan solo 
definir de la clase, no instanciarla. 

La clausula import también permite importar varios modulos en la 
misma linea. En el siguiente ejemplo podemos ver como se importa 
con una sola clausula import los modulos de la distribucion por defecto 
de Python os, que engloba funcionalidad relativa al sistema operativo; 
sys, con funcionalidad relacionada con el propio intérprete de Python 
y time, en el que se almacenan funciones para manipular fechas y 
hor as. 

import os, sys, time 
print time.asctime() 

Sin duda os habréis fijado en este y el anterior ejemplo en un detalle 
importante, y es que, como vemos, es necesario preceder el nombre de 
los objetos que importamos de un modulo con el nombre del modulo 
al que pertenecen, o lo que es lo mismo, el espacio de nombres en el 
que se encuentran. Esto permite que no sobreescribamos accidental- 
mente aigun otro objeto que tuviera el mismo nombre al importar otro 
modulo. 

Sin embargo es posible utilizar la construccion from-import para 
ahorrarnos el tener que indicar el nombre del modulo antes del objeto 
que nos interesa. De esta forma se importa el objeto o los objetos que 
indiquemos al espacio de nombres actual. 

from time import asctime 
print asctime() 
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Aunque se considera una mala pråctica, también es posible importar 
todos los nombres del modulo al espacio de nombres actual usando el 
caracter *: 

from time import * 

Ahora bien, recordareis que a la hora de crear nuestro primer modulo 
insisti en que lo guardarais en el mismo directorio en el que se en- 
contraba el programa que lo importaba. Entonces, <:c6mo podemos 
importar los modulos os, sys o time si no se encuentran los archivos 
os . py, sys . py y t ime. py en el mismo directorio? 

A la hora de importar un modulo Python recorre todos los directorios 
indicados en la variable de entorno PYTHONPATH en busca de un archivo 
con el nombre adecuado. El valor de la variable PYTHONPATH se puede 
consultar desde Python mediante sys. path 

»> import sys 
»> sys.path 

De esta forma para que nuestro modulo estuviera disponible para 
todos los programas del sistema bastaria con que lo copiåramos a uno 
de los directorios indicados en PYTHONPATH. 

En el caso de que Python no encontrara ningun modulo con el nom¬ 
bre especificado, se lanzaria una excepcion de tipo ImportError. 

Por ultimo es interesante comentar que en Python los modulos 
también son objetos; de tipo module en concreto. Por supuesto esto 
significa que pueden tener atributos y métodos. Uno de sus atributos, 

_ name _, se utiliza a menudo para incluir codigo ejecutable en un 

modulo pero que este solo se ejecute si se llama al modulo como pro¬ 
grama, y no al importarlo. Para lograr esto basta saber que cuando se 

ejecuta el modulo directamente_ name _tiene como valor "_ main_ ", 

mientras que cuando se importa, el valor de_ name _es el nombre del 

modulo: 

print "Se muestra siempre" 

if_name_== "_main_": 

print "Se muestra si no es importacion" 
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Otro atributo interesante es_doc_, que, como en el caso de fun- 

ciones y clases, sirve a modo de documentacion del objeto (docstring 
o cadena de documentacion). Su valor es el de la primera linea del 
cuerpo del modulo, en el caso de que esta sea una cadena de texto; en 
caso contrario valdrå None. 

Paquetes 

Si los modulos sirven para organizar el codigo, los paquetes sirven para 
organizar los modulos. Los paquetes son tipos especiales de modulos 
(ambos son de tipo module) que permiten agrupar modulos relacio- 
nados. Mientras los modulos se corresponden a nivel fisico con los 
archivos, los paquetes se representan mediante directorios. 

En una aplicacion cualquiera podriamos tener, por ejemplo, un paque- 
te iu para la interfaz o un paquete bbdd para la persistencia a base de 
datos. 

Para hacer que Python trate a un directorio como un paquete es nece- 

sario crear un archivo_init_.py en dicha carpeta. En este archivo se 

pueden definir elementos que pertenezcan a dicho paquete, como una 
constante DRIVER para el paquete bbdd, aunque habitualmente se trata- 
rå de un archivo vado. Para hacer que un cierto modulo se encuentre 
dentro de un paquete, basta con copiar el archivo que define el modulo 
al directorio del paquete. 

Como los modulos, para importar paquetes también se utiliza import 
y from-import y el caracter . para separar paquetes, subpaquetes y 
modulos. 

import paq.subpaq.modulo 
paq.subpaq.modulo.func() 

A lo largo de los proximos capftulos veremos algunos modulos y pa¬ 
quetes de utilidad. Para encontrar aigun modulo o paquete que cubra 
una cierta necesidad, puedes consultar la lista de PyPI (Python Pac- 
kage Index) en http://pypi.python.org / , que cuenta a la hora de escribir 
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estas lfneas, con mås de 4000 paquetes distintos. 
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Nuestros programas serian de muy poca utilidad si no fueran capaces 
de interaccionar con el usuario. En capitulos anteriores vimos, de pasa- 
da, el uso de la palabra clave print para mostrar mensajes en pantalla. 

En esta leccion, ademås de describir mås detalladamente del uso de 
print para mostrar mensajes al usuario, aprenderemos a utilizar las 
funciones input yraw_input para pedir informacion, asi como los 
argumentos de linea de comandos y, por ultimo, la entrada/salida de 
ficheros. 


Entrada eståndar 

La forma mås sencilla de obtener informacion por parte del usuario 
es mediante la funcion raw_input. Esta funcion toma como paråme- 
tro una cadena a usar como prompt (es decir, como texto a mostrar al 
usuario pidiendo la entrada) y devuelve una cadena con los caracteres 
introducidos por el usuario hasta que pulso la tecla Enter. Veamos un 
pequeno ejemplo: 

nombre = raw_input("Como te llamas? ") 
print "Encantado, " + nombre 

Si necesitåramos un entero como entrada en lugar de una cadena, por 
ejemplo, podriamos utilizar la funcion int para convertir la cadena a 
entero, aunque seria conveniente tener en cuenta que puede lanzarse 
una excepcion si lo que introduce el usuario no es un numero. 

try: 

edad = raw_input("Cuantos anyos tienes? ") 
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dias = int(edad) * 365 
print "Has vivido " + str(dias) + " dias" 
except ValueError: 

print "Eso no es un numero" 


La funcion input es un poco mås complicada. Lo que hace esta fun- 
cion es utilizar raw_input para leer una cadena de la entrada eståndar, 
y después pasa a evaluarla como si de codigo Python se tratara; por lo 
tanto input deberia tratarse con sumo cuidado. 


Paråmetros de Imea de comando 

Ademås del uso de inputyraw_ input el programador Python cuen- 
ta con otros métodos para obtener datos del usuario. Uno de ellos es 
el uso de paråmetros a la hora de llamar al programa en la Imea de 
comandos. Por ejemplo: 

python editor.py hola.txt 

En este caso hola.txt seria el paråmetro, al que se puede acceder a 
través de la lista sys . argv, aunque, como es de suponer, antes de poder 
utilizar dicha variable debemos importar el modulo sys. sys . argv[0] 
contiene siempre el nombre del programa tal como lo ha ejecutado el 
usuario, sys . argv[ 1 ], si existe, seria el primer paråmetro; sys . argv[2] 
el segundo, y asi sucesivamente. 

import sys 

if(len(sys.argv) > 1): 

print "Abriendo " + sys.argv[1] 
else: 

print "Debes indicar el nombre del archivo" 

Existen modulos, como optparse, que facilitan el trabajo con los argu¬ 
mentos de la linea de comandos, pero explicar su uso queda fuera del 
objetivo de este capitulo. 

Salida eståndar 

La forma mås sencilla de mostrar algo en la salida eståndar es median¬ 
te el uso de la sentencia print, como hemos visto multitud de veces en 
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ejemplos anteriores. En su forma mås båsica a la palabra clave print le 
sigue una cadena, que se mostrarå en la salida eståndar al ejecutarse el 
estamento. 

>» print "Hola mundo" 

Hola mundo 

Después de imprimir la cadena pasada como paråmetro el puntero se 
situa en la siguiente linea de la pantalla, por lo que el print de Python 
funciona igual que el print In de Java. 

En aigunas funciones equivalentes de otros lenguajes de programacion 
es necesario anadir un caråcter de nueva linea para indicar explicita- 
mente que queremos pasar a la siguiente linea. Este es el caso de la 
funcion printf de Co la propia funcion print de Java. 

Ya explicamos el uso de estos caracteres especiales durante la explica- 
cion del tipo cadena en el capitulo sobre los tipos båsicos de Python. 
La siguiente sentencia, por ejemplo, imprimiria la palabra “Hola”, 
seguida de un renglon vado (dos caracteres de nueva linea, ' \n'), y 
a continuacion la palabra “mundo” indentada (un caråcter tabulador, 
'\t'). 

print "Hola\n\n\tmundo" 

Para que la siguiente impresion se realizara en la misma linea tendria- 
mos que colocar una coma al final de la sentencia. Comparemos el 
resultado de es te codigo: 

>» for i in range(3): 

»> . . . print i, 

0 1 2 

Con el de este otro, en el que no utiliza una coma al final de la senten¬ 
cia: 

>» for i in range(3): 

>» . . .print i 
0 
1 
2 
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Este mecanismo de colocar una coma al final de la sentencia funcio- 
na debido a que es el sfmbolo que se utiliza para separar cadenas que 
queramos imprimir en la misma linea. 

»> print "Hola", "mundo" 

Hola mundo 


Esto se diferencia del uso del operador + para concatenar las cadenas 
en que al utilizar las comas print introduce automåticamente un espa- 
cio para separar cada una de las cadenas. Este no es el caso al utilizar 
el operador +,ya que lo que le llega a print es un solo argumento: una 
cadena ya concatenada. 

»> print "Hola" + "mundo" 

Holamundo 


Ademås, al utilizar el operador + tendriamos que convertir antes cada 
argumento en una cadena de no serlo ya, ya que no es posible concate¬ 
nar cadenas y otros tipos, mientras que al usar el primer método no es 
necesaria la conversion. 

»> print "Cuesta", 3, "euros" 

Cuesta 3 euros 

»> print "Cuesta" + 3 + "euros" 

<type 'exceptions.TypeError'>: cannot concatenate 'str' and 
'int' objects 


La sentencia pr int, o mås bien las cadenas que imprime, permiten 
también utilizar técnicas avanzadas de formateo, de forma similar al 
sprintf de C. Veamos un ejemplo bastante simple: 

print "Hola %s" % "mundo" 
print "%s %s" % ("Hola", "mundo") 


Lo que hace la primera linea es introducir los valores a la derecha del 
simbolo % (la cadena "mundo") en las posiciones indicadas por los espe- 
cificadores de conversion de la cadena a la izquierda del simbolo %, tras 
convertirlos al tipo adecuado. 


En la segunda linea, vemos como se puede pasar mås de un valor a 
sustituir, por medio de una tupla. 
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En este ejemplo solo tenemos un especificador de conversion: %s. 

Los especificadores mås sencillos estån formados por el simbolo % 
seguido de una letra que indica el tipo con el que formatear el valor 
Por ejemplo: 


Especificador 

Formato 

%s 

Cadena 

%d 

Entero 

%o 

Octal 

%x 

Hexadecimal 

%f 

Real 


Se puede introducir un numero entre el%y el caråcter que indica el 
tipo al que formatear, indicando el numero mmimo de caracteres que 
queremos que ocupe la cadena. Si el tamano de la cadena resultante 
es menor que este numero, se anadirån espacios a la izquierda de la 
cadena. En el caso de que el numero sea negativo, ocurrirå exactamente 
lo mismo, solo que los espacios se anadirån a la derecha de la cadena. 

>» print "%10s mundo" % "Hola" 

_Hola mundo 

>» print "%-10s mundo" % "Hola" 

Hola_mundo 

En el caso de los reales es posible indicar la precision a utilizar prece- 
diendo la f de un punto seguido del numero de decimales que quere¬ 
mos mostrar: 

»> from math import pi 
>» print "%.4f" % pi 
3.1416 

La misma sintaxis se puede utilizar para indicar el numero de caracte¬ 
res de la cadena que queremos mostrar 

»> print "%.4s" % "hola mundo" 
hola 
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Archivos 


Los ficheros en Python son objetos de tipo file creados mediante la 
funcion open (abrir). Esta funcion toma como paråmetros una cadena 
con la ruta al fichero a abrir, que puede ser relativa o absoluta; una 
cadena opcional indicando el modo de acceso (si no se especifica se 
accede en modo lectura) y, por ultimo, un entero opcional para especi- 
ficar un tamano de buffer distinto del utilizado por defecto. 

El modo de acceso puede ser cualquier combinacion logica de los 
siguientes modos: 

• ' r': read, lectura. Abre el archivo en modo lectura. El archivo tiene 
que existir previamente, en caso contrario se lanzarå una excepcion 
de tipo IOError. 

• ' w': write, escritura. Abre el archivo en modo escritura. Si el archi¬ 
vo no existe se crea. Si existe, sobreescribe el contenido. 

• ' a': append, anadir. Abre el archivo en modo escritura. Se diferen- 
cia del modo ' w' en que en este caso no se sobreescribe el conteni¬ 
do del archivo, sino que se comienza a escribir al final del archivo. 

• ' b': binary, binario. 

• ' +': permite lectura y escritura simultåneas. 

• ' U': universal newline, saltos de linea universales. Permite trabajar 
con archivos que tengan un formato para los saltos de linea que no 
coincide con el de la plataforma actual (en Windows se utiliza el 
caracter CR LF, en Unix LF y en Mac OS CR). 

f = open("archivo .txt", "w") 

Tras crear el objeto que representa nuestro archivo mediante la funcion 
open podremos realizar las operaciones de lectura/escritura pertinen- 
tes utilizando los métodos del objeto que veremos en las siguientes 
secciones. 

Una vez terminemos de trabajar con el archivo debemos cerrarlo utili¬ 
zando el método cl ose. 

Lectura de archivos 
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Para la lectura de archivos se utilizan los métodos read, readline y 
realines. 

El método read devuelve una cadena con el contenido del archivo o 
bien el contenido de los primeros n bytes, si se especifica el tamano 
måximo a leer. 

completo = f.read() 
parte = f2.read(512) 

El método readline sirve para leer las lineas del fichero una por una. 
Es decir, cada vez que se llama a este método, se devuelve el conteni¬ 
do del archivo desde el puntero hasta que se encuentra un caråcter de 
nueva linea, incluyendo este caråcter. 

while True: 

linea = f.readline() 
if not linea: break 
print linea 

Por ultimo, read li nes, funciona leyendo todas las lineas del archivo y 
devolviendo una lista con las lineas leidas. 

Escritura de archivos 

Para la escritura de archivos se utilizan los método writeywritelines. 
Mientras el primero funciona escribiendo en el archivo una cadena de 
texto que toma como paråmetro, el segundo toma como paråmetro una 
lista de cadenas de texto indicando las lineas que queremos escribir en 
el fichero. 

Mover el puntero de lectura/escritura 

Hay situaciones en las que nos puede interesar mover el puntero de 
lectura/escritura a una posicion determinada del archivo. Por ejemplo 
si queremos empezar a escribir en una posicion determinada y no al 
final o al principio del archivo. 

Para esto se utiliza el método seek que toma como paråmetro un nu- 
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mero positivo o negativo a utilizar como desplazamiento. También es 
posible utilizar un segundo paråmetro para indicar desde donde quere- 
mos que se haga el desplazamiento: 0 indicarå que el desplazamiento 
se refiere al principio del fichero (comportamiento por defecto), 1 se 
redere a la posicion actual, y 2, al final del fichero. 

Para determinar la posicion en la que se encuentra actualmente el 
puntero se utiliza el método tell(), que devuelve un entero indicando 
la distancia en bytes desde el principio del fichero. 
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Las expresiones regulares, también llamadas regex o regexp , consisten 
en patrones que describen conjuntos de cadenas de caracteres. 

Algo parecido seria escribir en la lfnea de comandos de Windows 
dir *.exe 

' * .exe' seria una “expresion regular”que describiria todas las cadenas 
de caracteres que empiezan con cualquier cosa seguida de '.exe', es 
decir, todos los archivos exe. 

El trabajo con expresiones regulares en Python se realiza mediante el 
modulo re, que data de Python 1.5 y que proporciona una sintaxis para 
la creacion de patrones similar a la de Perl. En Python 1.6 el modulo 
se reescribio para do tar lo de soporte de cadenas Unicode y mej orar su 
rendimiento. 

El modulo re contiene funciones para buscar patrones dentro de una 
cadena (search), comprobar si una cadena se ajusta a un determinado 
criterio descrito mediante un patron (match), dividir la cadena usando 
las ocurrencias del patron como puntos de ruptura (split) o para sus- 
tituir todas las ocurrencias del patron por otra cadena (sub). Veremos 
estas funciones y alguna mås en la proxima seccion, pero por ahora, 
aprendamos algo mås sobre la sintaxis de las expresiones regulares. 

Patrones 

La expresion regular mås sencilla consiste en una cadena simple, que 
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describe un conjunto compuesto tan solo por esa misma cadena. Por 
ejemplo, veamos como la cadena "python" coincide con la expresion 
regular "python" usando la funcion match: 

import re 

if re.match("python", "python"): 
print "cierto" 

Si quisiéramos comprobar si la cadena es "python", " jython", 

"cython" o cualquier otra cosa que termine en "ython", podriamos 
utilizar el caråcter comodin, el punto ' . ': 

re.match(".ython", "python") 
re.match(".ython", "jython") 

La expresion regular " .ython" describiria a todas las cadenas que con- 
sistan en un caråcter cualquiera, menos el de nueva linea, seguido de 
"ython". Un caråcter cualquiera y solo uno. No cero, ni dos, ni tres. 

En el caso de que necesitåramos el caråcter ' . ' en la expresion regular, 
o cualquier otro de los caracteres especiales que veremos a continua- 
cion, tendriamos que escaparlo utilizando la barra invertida. 

Para comprobar si la cadena consiste en 3 caracteres seguidos de un 
punto, por ejemplo, podriamos utilizar lo siguiente: 

re.match(".., "abc.") 

Si necesitåramos una expresion que solo resultara cierta para las cade¬ 
nas "python", "jython" y "cython" y ninguna otra, podriamos utilizar 
el caråcter ' I ' para expresar alternativa escribiendo los tres subpatro- 
nes completos: 

re.match("pythonIjythonIcython", "python") 

o bien tan solo la parte que pueda cambiar, encerrada entre paréntesis, 
formando lo que se conoce como un grupo. Los grupos tienen una 
gran importancia a la hora de trabajar con expresiones regulares y este 
no es su unico uso, como veremos en la siguiente seccion. 
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re.match("(pljlc)ython", "python") 

Otra opcion consistiria en encerrar los caracteres ' p', ' j' y ' c' entre 
corchetes para formar una clase de caracteres, indicando que en esa po- 
sicion puede colocarse cualquiera de los caracteres de la clase. 

re.match("[pjc]ython", "python") 

<:Y si quisiéramos comprobar si la cadena es "pythonØ", "python 1", 
"python2",..., "python9"? En lugar de tener que encerrar los 10 digitos 
dentro de los corchetes podemos utilizar el guion, que sirve para indi- 
car rangos. Por ejemplo a-d indicaria todas las letras minusculas de la 
'a' ala 'd'; 0-9 serian todos los numeros de 0 a 9 inclusive. 

re.match("python[0-9]", "pythonØ") 

Si quisiéramos, por ejemplo, que el ultimo caråcter fuera o un digito o 
una letra simplemente se escribirian dentro de los corchetes todos los 
criterios, uno detras de otro. 

re.match("python[0-9a-zA-Z]", "pythonp") 

Es necesario advertir que dentro de las clases de caracteres los caracte¬ 
res especiales no necesitan ser escapados. Para comprobar si la cadena 
es "python." o "python entonces, escribiriamos: 

re.match("python[.,]", "python.") 
y no 

re.match("python[\.,]", "python.") 

ya que en este ultimo caso estariamos comprobando si la cadena es 
"python .", "python ," o "pythonW 

Los conjuntos de caracteres también se pueden negar utilizando el 
simbolo ' A '. La expresion "python[ A 0-9a-z ]", por ejemplo, indicaria 
que nos interesan las cadenas que comiencen por "python" y tengan 
como ultimo caråcter algo que no sea ni una letra minuscula ni un 
numero. 
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re. match("python[ A 0-9a-z]" , "python+") 

El uso de [ 0 - 9 ] para referirse a un digito no es muy comun, ya que, al 
ser la comprobacion de que un caråcter es un digito algo muy utilizado, 
existe una secuencia especial equivalente: ' \d'. Existen otras secuen- 
cias disponibles que listamos a continuacion: 

• " \d": un digito. Equivale a [ 0 - 9 ] 

• " \D": cualquier caråcter que no sea un digito. Equivale a [ A 0 - 9 ] 

• " \ w ": cualquier caracter alfanumérico. Equivale a [ a - zA - ZØ - 9_ ] 

• " \ W": cualquier caråcter no alfanumérico. Equivale a [ A a - zA- 
ZØ-9_] 

• "\s": cualquier caråcter en blanco. Equivale a [ \t\n\r\f\v] 

• "\S": cualquier caråcter que no sea un espacio en blanco. Equivale 
a [ A \t\n\r\f\v] 

Veamos ahora como representar repeticiones de caracteres, dado que 
no seria de mucha utilidad tener que, por ejemplo, escribir una expre- 
sion regular con 30 caracteres ' \d' para buscar numeros de 30 digitos. 
Para este menester tenemos los caracteres especiales +, * y ?, ademås de 
las liaves {}. 

El caråcter + indica que lo que tenemos a la izquierda, sea un caråc¬ 
ter como ' a', una clase como ' [ abc ]' o un subpatron como (abc), 
puede encontrarse una o mas veces. Por ejemplo la expresion regular 
"python+" describiria las cadenas "python", "pythonn" y "pythonnn", 
pero no "pytho",ya que debe håber al menos una n. 

El caråcter * es similar a +, pero en este caso lo que se situa a su iz¬ 
quierda puede encontrarse cero o mas veces. 

El caråcter ? indica opcionalidad, es decir, lo que tenemos a la izquier¬ 
da puede o no aparecer (puede aparecer 0 o 1 veces). 

Finalmente las liaves sirven para indicar el numero de veces exacto que 
puede aparecer el caråcter de la izquierda, o bien un rango de veces que 
puede aparecer. Por ejemplo {3} indicaria que tiene que aparecer exac- 
tamente 3 veces, {3,8} indicaria que tiene que aparecer de 3 a 8 veces, 
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{, 8} de 0 a 8 veces y {3,} tres veces o mas (las que sean). 

Otro elemento interesante en las expresiones regulares, para terminar, 
es la especificacion de las posiciones en que se tiene que encontrar la 
cadena, esa es la utilidad de A y $, que indican, respectivamente, que el 
elemento sobre el que actuan debe ir al principio de la cadena o al final 
de esta. 

La cadena "http: //mundogeek. net ", por ejemplo, se ajustarfa a la 
expresion regular " A http", mientras que la cadena "El protocolo es 
http" no lo haria,ya que el http no se encuentra al principio de la 
cadena. 

Usando el modulo re 

Ya hemos visto por encima como se utiliza la funcion match del modu¬ 
lo re para comprobar si una cadena se ajusta a un determinado patron. 
El primer paråmetro de la funcion es la expresion regular, el segundo, 
la cadena a comprobar y existe un tercer paråmetro opcional que con- 
tiene distintos flags que se pueden utilizar para modificar el comporta- 
miento de las expresiones regulares. 

Algunos ejemplos de flags del modulo re son re. IGNORECASE, que hace 
que no se tenga en cuenta si las letras son mayusculas o minusculas o 
re. VERBOSE, que hace que se ignoren los espacios y los comentarios en 
la cadena que representa la expresion regular. 

El valor de retorno de la funcion serå None en caso de que la cadena no 
se ajuste al patron o un objeto de tipo MatchOb ject en caso contrario. 
Este objeto MatchOb ject cuenta con métodos startyend que devuel- 
ven la posicion en la que comienza y finaliza la subcadena reconocida y 
métodos group y groups que permiten acceder a los grupos que propi- 
ciaron el reconocimiento de la cadena. 

Al llamar al método group sin paråmetros se nos devuelve el grupo 0 
de la cadena reconocida. El grupo 0 es la subcadena reconocida por 
la expresion regular al completo, aunque no existan paréntesis que 
delimiten el grupo. 
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»> mo = re.match("http://.+\net", "http://mundogeek.net") 
»> print mo.group() 
http://mundogeek.net 


Podriamos crear grupos utilizando los paréntesis, como aprendimos 
en la seccion anterior, obteniendo asi la parte de la cadena que nos 
interese. 

»> mo = re.match("http://(.+)\net", "http://mundogeek.net") 

»> print mo.group(Ø) 

http://mundogeek.net 

»> print mo.group( 1) 

mundogeek 


El método groups, por su parte, devuelve una lista con todos los gru¬ 
pos, exceptuando el grupo O, que se omite. 

»> mo = re.match("http://(.+)\(.{3})", "http://mundogeek. 
net") 

»> print mo.groups() 

('mundogeek', 'net') 


La funcion search del modulo re funciona de forma similar a match; 
contamos con los mismos paråmetros y el mismo valor de retorno. 

La unica diferencia es que al utilizar match la cadena debe ajustarse al 
patron desde el primer caråcter de la cadena, mientras que con search 
buscamos cualquier parte de la cadena que se ajuste al patron. Por esta 
razon el método start de un objeto MatchOb ject obtenido mediante la 
funcion match siempre devolverå O, mientras que en el caso de search 
esto no tiene por qué ser asi. 

Otra funcion de busqueda del modulo re es f i ndal 1. Este toma los 
mismos paråmetros que las dos funciones anteriores, pero devuelve una 
lista con las subcadenas que cumplieron el patron. 

Otra posibilidad, si no queremos todas las coincidencias, es utilizar 
f indi ter, que devuelve un iterador con el que consultar uno a uno los 
distintos MatchOb ject. 


Las expresiones regulares no solo permiten realizar busquedas o 
comprobaciones, sino que, como comentamos anteriormente, también 
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tenemos funciones disponibles para dividir la cadena o realizar reem- 
plazos. 

La funcion split sin ir mås lejos toma como paråmetros un patron, 
una cadena y un entero opcional indicando el numero måximo de 
elementos en los que queremos dividir la cadena, y utiliza el patron a 
modo de puntos de separacion para la cadena, devolviendo una lista 
con las subcadenas. 

La funcion sub toma como paråmetros un patron a sustituir, una 
cadena que usar como reemplazo cada vez que encontremos el patron, 
la cadena sobre la que realizar las sustituciones, y un entero opcional 
indicando el numero måximo de sustituciones que queremos realizar. 

Al llamar a estos métodos lo que ocurre en realidad es que se crea un 
nuevo objeto de tipo RegexObject que representa la expresion regular, y 
se llama a métodos de este objeto que tienen los mismos nombres que 
las funciones del modulo. 

Si vamos a utilizar un mismo patron varias veces nos puede interesar 
crear un objeto de este tipo y llamar a sus métodos nosotros mismos; 
de esta forma evitamos que el intérprete tenga que crear un nuevo 
objeto cada vez que usemos el patron y mejoraremos el rendimiento de 
la aplicacion. 

Para crear un objeto RegexObject se utiliza la funcion compi le del 
modulo, al que se le pasa como paråmetro la cadena que representa el 
patron que queremos utilizar para nuestra expresion regular y, opcio- 
nalmente, una serie de flags de entre los que comentamos anterior- 
mente. 
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La comunicacion entre distintas entidades en una red se basa en 
Python en el clåsico concepto de sockets. Los sockets son un concepto 
abstracto con el que se designa al punto final de una conexion. 

Los programas utilizan sockets para comunicarse con otros programas, 
que pueden estar situados en computadoras distintas. 

Un socket queda definido por la direccion IP de la måquina, el puerto 
en el que escucha, y el protocolo que utiliza. 

Los tipos y funciones necesarios para trabajar con sockets se encuen- 
tran en Python en el modulo socket, como no podrfa ser de otra 
forma. 

Los sockets se clasifican en sockets de flujo (socket . SOCK_STREAM) o 
sockets de datagramas (socket . SOCK_DGRAM) dependiendo de si el ser- 
vicio utiliza TCP, que es orientado a conexion y fiable, o UDP, respec- 
tivamente. En este capftulo solo cubriremos los sockets de flujo, que 
cubren un 90% de las necesidades comunes. 

Los sockets también se pueden clasificar segun la familia. Tenemos 
sockets UNIX (socket .AF_UNIX) que se crearon antes de la concepcion 
de las redes y se basan en ficheros, sockets socket . AF_INET que son los 
que nos interesan, sockets socket . AF_INET6 para IPv6, etc. 

Para crear un socket se utiliza el constructor socket.socket() que pue- 
de tomar como paråmetros opcionales la familia, el tipo y el protocolo. 
Por defecto se utiliza la familia AF_INET y el tipo S0CK_STREAM. 

Veremos durante el resto del capftulo como crear un par de programas 
cliente y servidor a modo de ejemplo. 
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Lo primero que tenemos que hacer es crear un objeto socket para el 
servidor 

socket_s = socket.socket() 

Tenemos ahora que indicar en qué puerto se va a mantener a la escu- 
cha nuestro servidor utilizando el método bind. Para sockets IP, como 
es nuestro caso, el argumento de bind es una tupla que contiene el 
host y el puerto. El host se puede dej ar vacio, indicando al método que 
puede utilizar cualquier nombre que esté disponible. 

socket_s.bind(("localhost", 9999)) 

Por ultimo utilizamos listen para hacer que el socket acepte conexio- 
nes entrantes y accept para comenzar a escuchar. El método listen 
requiere de un paråmetro que indica el numero de conexiones måximas 
que queremos aceptar; evidentemente, este valor debe ser al menos 1. 

El método accept se mantiene a la espera de conexiones entrantes, 
bloqueando la ejecucion hasta que llega un mensaje. 

Cuando llega un mensaje, accept desbloquea la ejecucion, devolviendo 
un objeto socket que representa la conexion del cliente y una tupla que 
contiene el host y puerto de dicha conexion. 

socket_s.listen(10) 

socket_c, (host_c, puerto_c) = socket_s.accept() 

Una vez que tenemos este objeto socket podemos comunicarnos con 
el cliente a través suyo, mediante los métodos recv y send (o recvf rom 
y sendf rom en UDP) que permiten recibir o enviar mensajes respec- 
tivamente. El método send toma como paråmetros los datos a enviar, 
mientras que el método recv toma como paråmetro el numero måxi- 
mo de bytes a aceptar. 

recibido = socket_c.recv(1024) 
print "Recibido: ", recibio 
socket_c.send(recibido) 
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Una vez que hemos terminado de trabajar con el socket, lo cerramos 
con el método cl ose. 


Crear un cliente es aun mås sencillo. Solo tenemos que crear el objeto 
socket, utilizar el método connect para conectarnos al servidor y uti- 
lizar los métodos send y recv que vimos anteriormente. El argumento 
de connect es una tupla con host y puerto, exactamente igual que bind. 

socket_c = socket.socket() 

socket_c.connect(("localhost", 9999)) 

socket_c.send("hola") 


Veamos por ultimo un ejemplo completo. En este ejemplo el cliente 
manda al servidor cualquier mensaje que escriba el usuario y el servi¬ 
dor no hace mås que repetir el mensaje recibido. La ejecucion termina 
cuando el usuario escribe quit. 


Este seria el codigo del script servidor: 

import socket 

s = socket.socket() 
s.bind(("localhost", 9999)) 
s . 1 i sten(1) 

sc, addr = s.accept() 

while True: 

recibido = sc.recv(1024) 
if recibido == "quit": 
break 

print "Recibido:", recibido 
sc.send(recibido) 

print "adios" 

sc.close() 

s.close() 


Y a continuacion tenemos el del script cliente: 


import socket 

s = socket.socket() 

s.connect(("localhost", 9999)) 
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while True: 

mensaje = raw_input("> ") 
s.send(mensaje) 
mensaje == "quit": 
break 

print "adios" 
s.close() 
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Existen dos modulos principales para leer datos de URLs en Python: 
urllibyurllib2.En esta leccion aprenderemos a utilizar u r 11 i b 2 
ya que es mucho mås completo, aunque urllib tiene funcionalidades 
propias que no se pueden encontrar enurllib2, por lo que también lo 
tocaremos de pasada. 

urllib2 puede leer datos de una URL usando varios protocolos como 
HTTP, HTTPS, FTP, o Gopher. 

Se utiliza una funcion urlopen para crear un objeto parecido a un 
fichero con el que leer de la URL. Este objeto cuenta con métodos 
como read, readline, readlines y close, los cuales funcionan exac- 
tamente igual que en los objetos file, aunque en realidad estamos 
trabajando con un wrapper que nos abstrae de un socket que se utiliza 
por debajo. 

El método read, como recordareis, sirve para leer el “archivo” completo 
o el numero de bytes especificado como paråmetro, readline para leer 
una linea,y readlines para leer todas las lineas y devolver una lista con 
ellas. 

También contamos con un par de métodos geturl, para obtener la 
URL de la que estamos leyendo (que puede ser util para comprobar si 
ha habido una redireccion) e i n f o que nos devuelve un objeto con las 
cabeceras de respuesta del servidor (a las que también se puede acceder 
mediante el atributo headers). 

import urllib2 
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try: 

f = urllib2.urlopen("http://www.python.org") 
print f.read() 
f.close() 

except HTTPError, e: 

print "Ocurrio un error" 
print e.code 
except URLError, e: 

print "Ocurrio un error" 
print e.reason 


Al trabajar con urllib2 nos podemos encontrar, como vemos, con 
errores de tipo URLError. Si trabajamos con HTTP podemos encon- 
trarnos también con errores de la subclase de URLError HTTPError, que 
se lanzan cuando el servidor devuelve un codigo de error HTTP, como 
el error 404 cuando no se encuentra el recurso. También podriamos 
encontrarnos con errores lanzados por la libreria que urllib2 utiliza 
por debajo para las transferencias HTTP: httplib;o con excepciones 
lanzadas por el propio modulo socket. 

La funcion urlopen cuenta con un paråmetro opcional data con el que 
poder enviar informacion a direcciones HTTP (y solo HTTP) usando 
POST (los paråmetros se envian en la propia peticion), por ejemplo 
para responder a un formulario. Este paråmetro es una cadena codifi- 
cada adecuadamente, siguiendo el formato utilizado en las URLs: 

'password=contrase%A4a&usuario=manuel' 


Lo mås sencillo para codificar la cadena es utilizar el método urlen- 
code de urllib, que acepta un diccionario o una lista de tuplas (clave, 
valor) y genera la cadena codificada correspondiente: 


import urllib, urllib2 

params = urllib.urlencode({"usuario": "manuel", 

"password": "contrasena"}) 

f = url1ib2.urlopen("http://ejemplo.com/login", params) 


Si lo unico que queremos hacer es descargar el contenido de una URL 
a un archivo local, podemos utilizar la funcion urlretrieve de urllib 
en lugar de leer de un objeto creado con urlopen y escribir los datos 
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leidos. 

La funcion urlretrieve toma como paråmetros la URL a descar- 
gar y, opcionalmente, un paråmetro f i lename con la ruta local en la 
que guardar el archivo, un paråmetro data similar al de urlopen y un 
paråmetro report hook con una funcion que utilizar para informar del 
progreso. 

A excepcion de las ocasiones en las que se utiliza el paråmetro data 
las conexiones siempre se realizan utilizando GET (los paråmetros se 
envian en la URL). Para enviar datos usando GET basta con concate- 
nar la cadena resultante de urlencode con la URL a la que nos vamos a 
conectar mediante el simbolo ?. 

params = urilib.urlencode({"usuario": "manuel", 

"password": "contrasena"}) 

f = urllib2.urlopen("http://ejemplo.com/login" + 

"?" + params) 

En urllib también se utiliza una funcion ur lopen para crear nuestros 
pseudo-archivos, pero a diferencia de la version de ur 11 ib, la funcion 
ur lopen de urllib2 también puede tomar como paråmetro un objeto 
Request, en lugar de la URL y los datos a enviar. 

La clase Request define objetos que encapsulan toda la informacion 
relativa a una peticion. A través de este objeto podemos realizar peti- 
ciones mås complejas, anadiendo nuestras propias cabeceras, como el 
User-Agent. 

El constructor mås sencillo para el objeto Request no toma mås que 
una cadena indicando la URL a la que conectarse, por lo que utilizar 
este objeto como paråmetro de ur lopen seria equivalente a utilizar una 
cadena con la URL directamente. 

Sin embargo el constructor de Request también tiene como paråme¬ 
tros opcionales una cadena data para mandar datos por POST y un 
diccionario headers con las cabeceras (ademås de un par de campos 
origin_req_host y unverif iable, que quedan fuera del proposito del 
capitulo por ser de raro uso). 
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Veamos como anadir nuestras propias cabeceras utilizando como 
ejemplo la cabecera User-Agent. El User-Agent es una cabecera que 
sirve para identificar el navegador y sistema operativo que estamos 
utilizando para conectarnos a esa URL. Por defecto urllib2se identi- 
fica como “Python-urllib/2.5”; si quisiéramos identificarnos como un 
Linux corriendo Konqueror por ejemplo, usariamos un codigo similar 
al siguiente: 

ua = "Mozilla/5.0 (compatible; Konqueror/3.5.8; Linux)" 
h = {"User-Agent": ua} 

r = urllib2.Request("http://www. python.org" , headers=h) 
f = urllib2.urlopen(r) 
print f.read() 

Para personalizar la forma en que trabaja urllib2 podemos instalar un 
grupo de manejadores ( handlers ) agrupados en un objeto de la clase 
OpenerDirector (opener o abridor), que serå el que se utilice a partir de 
ese momento al llamar a urlopen. 

Para construir un opener se utiliza la funcion bu i ld_opener a la que se 
le pasa los manej adores que formarån parte del opener. El opener se 
encargarå de encadenar la ejecucion de los distintos manejadores en el 
orden dado.También se puede usar el constructor de OpenerDirector, 
y anadir los manejadores usando su método add_handler. 

Para instalar el opener una vez creado se utiliza la funcion ins- 
tall_opener, que toma como paråmetro el opener a instalar.También 
se podria, si solo queremos abrir la URL con ese opener una sola vez, 
utilizar el método open del opener. 

urllib2 cuenta con handlers que se encargan de manejar los esquemas 
disponibles (HTTP, HTTPS, FTP), manejar la autenticacion, manejar 
las redirecciones, etc. 

Para anadir autenticacion tendriamos que instalar un opener que in- 
cluyera como manejador HTTPBasicAuthHandler, ProxyBasicAuthHan- 
dler, HTTPDigestAuthHandler y/o ProxyDigestAuthHandler. 

Para utilizar autenticacion HTTP båsica, por ejemplo, usariamos 
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HTTPBasicAuthHandler: 

aut_h = ur 11ib2.HTTPBasicAuthHandler() 

aut_h.add_password("realm", "host", "usuario", "password") 

opener = urllib2.build_opener(aut_h) 
urllib2.install_opener(opener) 

f = urllib2.urlopen("http://www. python.org") 

Si quisiéramos especificar un proxy en el codigo tendriamos que 
utilizar un opener que contuviera el manejador ProxyHandler. El 
manejador por defecto incluye una instacia de ProxyHandler construi- 
do llamando al inicializador sin paråmetros, con lo que se lee la lista 
de proxies a utilizar de la variable de entorno adecuada. Sin embargo 
también podemos construir un ProxyHandler pasando como paråme- 
tro al inicializador un diccionario cuyas claves son los protocolos y los 
valores, la URL del proxy a utilizar para dicho protocolo. 

proxy_h = urllib2.ProxyHandler({"http" : "http://miproxy. 
net:123"}) 

opener = urllib2.build_opener(proxy_h) 
urllib2.install_opener(opener) 

f = urllib2.urlopen("http://www. python.org") 

Para que se guarden las cookies que manda HTTP utilizamos el ma¬ 
nejador HTTPCookieProcessor. 

cookie_h = urllib2.HTTPCookieProcessor() 

opener = urllib2.build_opener(cookie_h) 
urllib2.install_opener(opener) 

f = urllib2.urlopen("http://www. python.org") 

Si queremos acceder a estas cookies o poder mandar nuestras propias 
cookies, podemos pasarie como paråmetro al inicializador de HTTPCoo¬ 
kieProcessor un objeto de tipo CookieJar del modulo cookielib. 

Para leer las cookies mandadas basta crear un objeto iterable a partir 
del Cookie Jar (también podriamos buscar las cabeceras correspondien- 
tes, pero este sistema es mås claro y sencillo): 
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import ur11ib2, cookielib 

cookie_j = cookielib.CookieJar() 

cookie_h = urllib2.HTTPCookieProcessor(cookie_j) 

opener = urllib2.build_opener(cookie_h) 
opener.open("http://www.python.org") 

for num, cookie in enumerate(cookie_j): 
print num, cookie.name 
print cookie.value 
print 


En el improbable caso de que necesitåramos anadir una cookie an- 
tes de realizar la conexion, en lugar de conectarnos para que el sitio 
la mande, podriamos utilizar el método set_cookie de CookieJar, al 
que le pasamos un objeto de tipo Cookie. El constructor de Cookie, no 
obstante, es bastante complicado. 
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iQué son los procesos y los 
threads? 

Las computadoras serian mucho menos utiles si no pudiéramos hacer 
mås de una cosa a la vez. Si no pudiéramos, por ejemplo, escuchar 
musica en nuestro reproductor de audio favorito mientras leemos un 
tutorial de Python en Mundo Geek. 

Pero, <:c6mo se conseguia esto en computadoras antiguas con un solo 
nucleo / una sola CPU? Lo que ocurria, y lo que ocurre ahora, es que 
en realidad no estamos ejecutando varios procesos a la vez (se llama 
proceso a un programa en ejecucion), sino que los procesos se van tur- 
nando y, dada la velocidad a la que ejecutan las instrucciones, nosotros 
tenemos la impresion de que las tareas se ejecutan de forma paralela 
como si tuviéramos multitarea real. 

Cada vez que un proceso distinto pasa a ejecutarse es necesario reali- 
zar lo que se llama un cambio de contexto, durante el cual se salva el 
estado del programa que se estaba ejecutando a memoria y se carga el 
estado del programa que va a entrar a ejecutarse. 

En Python podemos crear nuevos procesos mediante la funcion os. 
fork , que ejecuta la llamada al sistema fork, o mediante otras funcio- 
nes mås avanzadas como popen2. popen2, de forma que nuestro progra¬ 
ma pueda realizar varias tareas de forma paralela. 

Sin embargo el cambio de contexto puede ser relativamente lento, y 
los recursos necesarios para mantener el estado demasiados, por lo que 
a menudo es mucho mås eficaz utilizar lo que se conoce como threads , 
hilos de ejecucion, o procesos ligeros. 
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Los threads son un concepto similar a los procesos: también se trata de 
codigo en ejecucion. Sin embargo los threads se ejecutan dentro de un 
proceso, y los threads del proceso comparten recursos entre si, como la 
memoria, por ejemplo. 

El sistema operativo necesita menos recursos para crear y gestionar los 
threads, y al compartir recursos, el cambio de contexto es mås råpido. 
Ademås, dado que los threads comparten el mismo espacio de me¬ 
moria global, es sencillo compartir informacion entre ellos: cualquier 
variable global que tengamos en nuestro programa es vista por todos 
los threads. 


El GIL 

La ejecucion de los threads en Python estå controlada por el GIL 
(Global Interpreter Lock) de forma que solo un thread puede ejecutar- 
se a la vez, independientemente del numero de procesadores con el que 
cuente la måquina. Esto posibilita que el escribir extensiones en C para 
Python sea mucho mås sencillo, pero tiene la desventaja de limitar mu- 
cho el rendimiento, por lo que a pesar de todo, en Python, en ocasiones 
nos puede interesar mås utilizar procesos que threads, que no sufren de 
esta limitacion. 

Cada cierto numero de instrucciones de bytecode la måquina virtual 
para la ejecucion del thread y elige otro de entre los que estaban espe- 
rando. 

Por defecto el cambio de thread se realiza cada 10 instrucciones de 
bytecode, aunque se puede modificar mediante la funcion sys . set ¬ 
check interval. También se cambia de thread cuando el hilo se pone a 
dormir con time.sleep o cuando comienza una operacion de entrada/ 
salida, las cuales pueden tardar mucho en finalizar, y por lo tanto, de no 
realizar el cambio, tendriamos a la CPU demasiado tiempo sin trabajar 
esperando a que la operacion de E/S terminara. 

Para minimizar un poco el efecto del GIL en el rendimiento de nues- 
tra aplicacion es conveniente llamar al intérprete con el flag -0, lo que 
harå que se genere un bytecode optimizado con menos instrucciones, y, 
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por lo tanto, menos cambios de contexto. También podemos plantear- 
nos el utilizar procesos en lugar de threads, como ya comentamos, uti- 
lizando por ejemplo el modulo processing; escribir el codigo en el que 
el rendimiento sea critico en una extension en C o utilizar IronPython 
o Jython, que carecen de GIL. 

Threads en Python 

El trabajo con threads se lleva a cabo en Python mediante el modulo 
thread. Este modulo es opcional y dependiente de la plataforma, y 
puede ser necesario, aunque no es comun, recompilar el intérprete para 
anadir el soporte de threads. 

Ademås de thread, también contamos con el modulo threading que se 
apoya en el primero para proporcionarnos una API de mås alto nivel, 
mås completa,y orientada a objetos. El modulo threading se basa 
ligeramente en el modelo de threads de Java. 


El modulo threading contiene una clase Thread que debemos ex- 
tender para crear nuestros propios hilos de ejecucion. El método run 
contendrå el codigo que queremos que ejecute el thread. Si queremos 
especificar nuestro propio constructor, este deberå llamar a threading. 
Thread. i nit (self ) para inicializar el objeto correctamente. 

import threading 

class MiThread(threading.Thread): 

def _init_(self, num): 

threading.Thread._init_(self) 

self.num = num 

def run(self): 

print "Soy el hilo", self.num 


Para que el thread comience a ejecutar su codigo basta con crear una 
instancia de la clase que acabamos de definir y llamar a su método 
start. El codigo del hilo principal y el del que acabamos de crear se 
ejecutarån de forma concurrente. 

print "Soy el hilo principal" 
for i in range(0, 10): 
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El método join se utiliza para que el hilo que ejecuta la llamada se 
bloquee hasta que finalice el thread sobre el que se llama. En este caso 
se utiliza para que el hilo principal no termine su ejecucion antes que 
los hijos, lo cuål podria resultar en aigunas plataformas en la termina- 
cion de los hijos antes de finalizar su ejecucion. El método join puede 
tomar como paråmetro un numero en coma flotante indicando el 
numero måximo de segundos a esperar. 

Si se intenta llamar al método start para una instancia que ya se estå 
ejecutando, obtendremos una excepcion. 

La forma recomendada de crear nuevos hilos de ejecucion consiste en 
extender la clase Thread, como hemos visto, aunque también es posible 
crear una instancia de Thread directamente, e indicar como paråmetros 
del constructor una clase ejecutable (una clase con el método especial 

_cal 1_) o una funcion a ejecutar, y los argumentos en una tupla 

(paråmetro args) o un diccionario (paråmetro kwargs). 

import threading 

def imprime(num): 

print "Soy el hilo", num 

print "Soy el hilo principal" 

for i in range(0, 10): 

t = threading.Thread(target=imprime, args=(i, )) 
t .start() 

Ademås de los paråmetros target, args y kwargs también podemos 
pasar al constructor un paråmetro de tipo cadena name con el nom- 
bre que queremos que tome el thread (el thread tendrå un nombre 
predeterminado aunque no lo especifiquemos); un paråmetro de tipo 
booleano ver bo se para indicar al modulo que imprima mensajes sobre 
el estado de los threads para la depuracion y un paråmetro group, que 
por ahora no admite ningun valor pero que en el futuro se utilizarå 
para crear grupos de threads y poder trabajar a nivel de grupos. 


105 



Python para todos 


Para comprobar si un thread sigue ejecutåndose, se puede utilizar el 
método i sAl i ve. También podemos asignar un nombre al hilo y con- 
sultar su nombre con los métodos setName y getName, respectivamente. 

Mediante la funcion threading. enumerate obtendremos una lista de 
los objetos Thread que se estån ejecutando, incluyendo el hilo principal 
(podemos comparar el objeto Thread con la variable main_thread para 
comprobar si se trata del hilo principal) y con threading. act iveCount 
podemos consultar el numero de threads ejecutåndose. 

Los objetos Thread también cuentan con un método setDaemon que 
toma un valor booleano indicando si se trata de un demonio. La utili- 
dad de esto es que si solo quedan threads de tipo demonio ejecutåndo¬ 
se, la aplicacion terminarå automåticamente, terminando estos threads 
de forma segura. 

Por ultimo tenemos en el modulo threading una clase Timer que he- 
reda de Thread y cuya utilidad es la de ejecutar el codigo de su método 
run después de un periodo de tiempo indicado como paråmetro en 
su constructor. También incluye un método cancel mediante el que 
cancelar la ejecucion antes de que termine el periodo de espera. 

Sincronizacion 

Uno de los mayores problemas a los que tenemos que enfrentarnos al 
utilizar threads es la necesidad de sincronizar el acceso a ciertos recur- 
sos por parte de los threads. Entre los mecanismos de sincronizacion 
que tenemos disponibles en el modulo threading se encuentran los 
locks, locks reentrantes, semåforos, condiciones y eventos. 

Los locks, también llamados mutex (de mutual exclusion), cierres 
de exclusion mutua, cierres o candados, son objetos con dos estados 
posibles: adquirido o libre. Cuando un thread adquiere el candado, los 
demås threads que lleguen a ese punto posteriormente y pidan adqui- 
rirlo se bloquearån hasta que el thread que lo ha adquirido libere el 
candado, momento en el cuål podrå entrar otro thread. 

El candado se representa mediante la clase Lock. Para adquirir el 
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candado se utiliza el método acquire del objeto, al que se le puede 
pasar un booleano para indicar si queremos esperar a que se libere 
(True) o no (False). Si indicamos que no queremos esperar, el método 
devolverå True o False dependiendo de si se adquirio o no el candado, 
respectivamente. Por defecto, si no se indica nada, el hilo se bloquea 
indefinidamente. 

Para liberar el candado una vez hemos terminado de ejecutar el bloque 
de codigo en el que pudiera producirse un problema de concurrencia, 
se utiliza el método release. 

lista = [] 

lock = threading.Lock() 

def anyadir(obj): 
lock.acquire() 
lista.append(obj) 
lock.release() 

def obtener(): 

lock.acquire() 
obj = lista.pop() 
lock.release() 
return obj 

La clase RLock funciona de forma similar a Lock, pero en este caso el 
candado puede ser adquirido por el mismo thread varias veces, y no 
quedarå liberado hasta que el thread llame a release tantas veces como 
llamo a acquire. Como en Lock, y como en todas las primitivas de sin- 
cronizacion que veremos a continuacion, es posible indicar a acquire si 
queremos que se bloquee o no. 

Los semåforos son otra clase de candados. La clase correspondiente, 
Semaphore, también cuenta con métodos acquire y release, pero se di- 
ferencia de un Lock normal en que el constructor de Semaphore puede 
tomar como paråmetro opcional un entero value indicando el numero 
måximo de threads que pueden acceder a la vez a la seccion de codigo 
critico. Si no se indica nada permite el acceso a un solo thread. 

Cuando un thread llama a acquire, la variable que indica el numero 
de threads que pueden adquirir el semåforo disminuye en 1, porque 
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hemos permitido entrar en la seccion de codigo critico a un hilo mås. 
Cuando un hilo llama arelease,la variable aumenta en 1. 

No es hasta que esta variable del semåforo es 0, que llamar a acquire 
producirå un bloqueo en el thread que realizo la peticion, a la espera de 
que aigun otro thread llame arelease para liberar su plaza. 

Es importante destacar que el valor inicial de la variable tal como lo 
pasamos en el constructor, no es un limite måximo, sino que multiples 
llamadas a release pueden hacer que el valor de la variable sea mayor 
que su valor original. Si no es esto lo que queremos, podemos utilizar 
la clase BoundedSemaphore en cuyo caso, ahora si, se consideraria un 
error llamar a release demasiadas veces, y se lanzaria una excepcion de 
tipo ValueError de superarse el valor inicial. 

Podriamos utilizar los semåforos, por ejemplo, en un pequeno pro¬ 
grama en el que multiples threads descargaran datos de una URL, de 
forma que pudieramos limitar el numero de conexiones a realizar al 
sitio web para no bombardear el sitio con cientos de peticiones concu- 
rrentes. 

semaforo = threading.Semaphore(4) 

def descargar(url): 
semaforo.acquire() 
urllib.urlretrieve(url) 
semaforo.release() 

Las condiciones (clase Condition) son de utilidad para hacer que los 
threads solo puedan entrar en la seccion critica de darse una cierta 
condicion o evento. Para esto utilizan un Lo c k pasado como paråmetro, 
o crean un objeto RLock automaticamente si no se pasa ningun parå¬ 
metro al constructor. 

Son especialmente adecuadas para el clåsico problema de productor- 
consumidor. La clase cuenta con métodos acquire y release, que 11a- 
marån a los métodos correspondientes del candado asociado. También 
tenemos métodos wait, notify y notifyAll. 

El método wait debe llamarse después de håber adquirido el candado 
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con acquire. Este método libera el candado y bloquea al thread hasta 
que una llamada a not ify o notifyAll en otro thread le indican que se 
ha cumplido la condicion por la que esperaba. El thread que informa a 
los demås de que se ha producido la condicion, también debe llamar a 
acquire antes de llamar a not ify o notifyAll. 


Al llamar a not i fy, se informa del evento a un solo thread, y por tanto 
se despierta un solo thread. Al llamar a notifyAll se despiertan todos 
los threads que esperaban a la condicion. 


Tanto el thread que notifica como los que son notificados tienen que 
terminar liberando el lock con release. 

lista = [] 

cond = threading.Condition() 

def consumir(): 
cond.acquire() 
cond.wait() 
obj = lista.pop() 
cond.release() 
return obj 

def producir(obj): 
cond.acquire() 
lista.append(obj) 
cond.notify() 
cond.release() 


Los eventos, implementados mediante al clase Event, son un wra- 
pper por encima de Condition y sirven principalmente para coordinar 
threads mediante senales que indican que se ha producido un evento. 
Los eventos nos abstraen del hecho de que estemos utilizando un Lock 
por debajo, por lo que carecen de métodos acquire y release. 


El thread que debe esperar el evento llama al método wait y se blo¬ 
quea, opcionalmente pasando como paråmetro un numero en coma 
flotante indicando el numero måximo de segundos a esperar. Otro 
hilo, cuando ocurre el evento, manda la senal a los threads bloqueados 
a la espera de dicho evento utilizando el método set. Los threads que 
estaban esperando se desbloquean una vez recibida la senal. El flag que 
determina si se ha producido el evento se puede volver a establecer a 
falso usando clear. 
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Como vemos los eventos son muy similares a las condiciones, a excep- 
cion de que se desbloquean todos los threads que esperaban el evento y 
que no tenemos que llamar a acquire y release. 

import threading, time 

class MiThread(threading.Thread): 

def _init_(self, evento): 

threading.Thread._init_(self) 

self.evento = evento 

def run(self): 

print self.getName(), "esperando al evento" 
self.evento.wait() 

print self.getName(), "termina la espera" 

evento = threading.Event() 
ti = MiThread(evento) 
t1.start() 

t2 = MiThread(evento) 
t2.start() 

# Esperamos un poco 
time.sleep(5) 
evento.set() 


Por ultimo, un pequeno extra. Si sois usuarios de Java sin duda estaréis 
echando en falta una palabra clave syncronized para hacer que solo 
un thread pueda acceder al método sobre el que se utiliza a la vez. Una 
construccion comun es el uso de un decorador para implementar esta 
funcionalidad usando un Lock. Seria algo asi: 

def synchronized(lock): 
def dec(f): 

def func_dec(*args, **kwargs): 
lock.acquire() 
try: 

return f(*args, **kwargs) 
finally: 

lock.release() 
return func_dec 
return dec 

class MyThread(threading.Thread): 

@synchronized(mi_lock) 
def run(self): 

print "metodo sincronizado" 
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Datos globales independientes 

Como ya hemos comentado los threads comparten las variables 
globales. Sin embargo pueden existir situaciones en las que queramos 
utilizar variables globales pero que estas variables se comporten como 
si fueran locales a un solo thread. Es decir, que cada uno de los threads 
tengan valores distintos independientes, y que los cambios de un deter- 
minado thread sobre el valor no se vean reflejados en las copias de los 
demås threads. 


Para lograr este comportamiento se puede utilizar la clase threading. 
local, que crea un almacén de datos locales. Primero debemos crear 
una instancia de la clase, o de una subclase, para después almacenar y 
obtener los valores a través de paråmetros de la clase. 

datos_locales = threading.local() 
datos_locales.mi_var = "hola" 
print datos_locales.mi_var 


Fijémonos en el siguiente codigo, por ejemplo. Para el hilo principal el 
objeto local tiene un atributo var, y por lo tanto el print imprime su 
valor sin problemas. Sin embargo para el hilo t ese atributo no existe, y 
por lo tanto lanza una excepcion. 

local = threading.local() 

def f(): 

print local.var 

local.var = "hola" 
t = threading.Thread(target=f) 
print local.var 
t.start() 
t.join() 

Compartir informacion 

Para compartir informacion entre los threads de forma sencilla po¬ 
demos utilizar la clase Queue .Queue, que implementa una cola (una 
estructura de datos de tipo FIFO) con soporte multihilo. Esta clase 
utiliza las primitivas de threading para ahorrarnos tener que sincroni- 
zar el acceso a los datos nosotros mismos. 
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El constructor de Queue toma un paråmetro opcional indicando el 
tamano måximo de la cola. Si no se indica ningun valor no hay limite 
de tamano. 


Para anadir un elemento a la cola se utiliza el método put(item); para 
obtener el siguiente elemento, get (). Ambos métodos tienen un parå¬ 
metro booleano opcional block que indica si queremos que se espere 
hasta que haya aigun elemento en la cola para poder devolverlo o hasta 
que la cola deje de estar llena para poder introducirlo. 

También existe un paråmetro opcional timeout que indica, en segun- 
dos, el tiempo måximo a esperar. Si el timeout acaba sin poder håber 
realizado la operacion debido a que la cola estaba llena o vacia, o bien 
si block era False, se lanzarå una excepcion de tipo Queue. Full o 
Queue. Empty, respectivamente. 


Con q s i z e ob tenemos el tamano de la cola yconempty()yfull() 
podemos comprobar si estå vacia o llena. 

q = Queue.Queue() 

class MiThread(threading.Thread): 

def _init_(self, q): 

self.q = q 

threading.Thread._init_(self) 

def run(self): 
while True: 
try: 

obj = q.get(False) 
except Queue.Empty: 
print "Fin" 
break 
print obj 

for i in range(10): 
q.put(i) 

t = MiThread(q) 
t.start() 
t.join() 
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Aigunas veces tenemos la necesidad de guardar un objeto a disco para 
poder recuperarlo mås tarde, o puede que nos sea necesario mandar un 
objeto a través de la red, a otro programa en Python ejecutåndose en 
otra måquina. 

Al proceso de transformar el estado de un objeto en un formato que se 
pueda almacenar, recuperar y transportar se le conoce con el nombre de 
serializacion o marshalling. 

En Python tenemos varios modulos que nos facilitan esta tarea, como 
marshal,pickle, cPickle y shelve. 

El modulo marshal es el mås båsico y el mås primitivo de los tres, y 
es que, de hecho, su proposito principal y su razon de ser no es el de 
serializar objetos, sino trabajar con bytecode Python (archivos .pyc). 

marshal solo permite serializar objetos simples (la mayoria de los tipos 
incluidos por defecto en Python), y no proporciona ningun tipo de 
mecanismo de seguridad ni comprobaciones frente a datos corruptos o 
mal formateados. Es mås, el formato utilizado para guardar el bytecode 
(y por tanto el formato utilizado para guardar los objetos con marshal) 
puede cambiar entre versiones, por lo que no es adecuado para almace¬ 
nar datos de larga duracion. 

pickle, por su parte, permite serializar casi cualquier objeto (objetos de 
tipos definidos por el usuario, colecciones que contienen colecciones, 
etc) y cuenta con algunos mecanismos de seguridad båsicos. Sin em¬ 
bargo, al ser mås complejo que marshal, y, sobre todo, al estar escrito en 
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Python en lugar de en C, como marshal, también es mucho mås lento. 

La solution, si la velocidad de la serializacion es importante para nues- 
tra aplicacion, es utilizar cPickle, que no es mås que es una implemen- 
tacion en C de pickle. cPickle es hasta 1000 veces mås råpido que 
pickle,y pråcticamente igual de råpido que marshal. 

Si intentamos importar cPickleyse produce un error por aigun moti¬ 
vo, se lanzarå una excepcion de tipo ImportError. Para utilizar cPickle 
si estå disponible y pickle en caso contrario, podriamos usar un codigo 
similar al siguiente: 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

as en un import sirve para importar el elemento seleccionado utilizan- 
do otro nombre indicado, en lugar de su nombre. 

La forma mås sencilla de serializar un objeto usando pickle es me¬ 
diante una llamada a la funcion dump pasando como argumento el 
objeto a serializar y un objeto archivo en el que guardarlo (o cualquier 
otro tipo de objeto similar a un archivo, siempre que ofrezca métodos 
read, realine y write). 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

fichero = fi1e("datos.dat", "w") 
animales = ["piton", "mono", "camello"] 

pickle.dump(animales, fichero) 

fichero.close() 

La funcion dump también tiene un paråmetro opcional protocol que 
indica el protocolo a utilizar al guardar. Por defecto su valor es 0, que 
utiliza formato texto y es el menos eficiente. El protocolo 1 es mås 
eficiente que el 0, pero menos que el 2. Tanto el protocolo 1 como el 2 
utilizan un formato binario para guardar los datos. 
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try: 

import cPickle as pickle 
except ImportError: 
import pickle 

fichero = fi1e("datos.dat", "w") 
animales = ["piton", "mono", "camello"] 

pickle.dump(animales, fichero, 2) 

fichero.close() 


Para volver a cargar un objeto serializado se utiliza la funcion load, a la 
que se le pasa el archivo en el que se guardo. 

try: 

import cPickle as pickle 
except ImportError: 
import pickle 

fichero = file("datos.dat", "w") 
animales = ["piton", "mono", "camello"] 

pickle.dump(animales, fichero) 

fichero.close() 

fichero = fi1e("datos.dat") 

animales2 = pickle.load(fichero) 
print animales2 


Supongamos ahora que queremos almacenar un par de listas en un fi¬ 
chero. Esto serfa tan sencillo como llamar una vez a dump por cada lista, 
y llamar después una vez a load por cada lista. 

fichero = fi1e("datos.dat", "w") 
animales = ["piton", "mono", "camello"] 
lenguajes = ["python", "mono", "perl"] 

pickle.dump(animales, fichero) 
pickle.dump(lenguajes, fichero) 

fichero = fi1e("datos.dat") 

animales2 = pickle.load(fichero) 
lenguajes2 = pickle.load(fichero) 
print animales2 
print lenguajes2 
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Pero, <;y si hubiéramos guardado 30 objetos y quisiéramos acceder al 
ultimo de ellos? <:o si no recordåramos en qué posicion lo habiamos 
guardado? El modulo s hel ve extiende pickle/ cPickle para propor- 
cionar una forma de realizar la serializacion mås clara y sencilla, en la 
que podemos acceder a la version serializada de un objeto mediante 
una cadena asociada, a través de una estructura parecida a un dicciona- 
rio. 

La unica funcion que necesitamos conocer del modulo shelve es open, 
que cuenta con un paråmetro f i lename mediante el que indicar la ruta 
a un archivo en el que guardar los objetos (en realidad se puede crear 
mås de un archivo, con nombres basados en f i lename, pero esto es 
transparente al usuario). 

La funcion open también cuenta con un paråmetro opcional protocol, 
con el que especificar el protocolo que queremos que utilice pickle por 
debajo. 

Como resultado de la llamada a open obtenemos un objeto Shelf , con 
el que podemos trabajar como si de un diccionario normal se tratase (a 
excepcion de que las claves solo pueden ser cadenas) para almacenar y 
recuperar nuestros objetos. 

Como un diccionario cualquiera la clase Shelf cuenta con métodos 
get, has_key, items, keys, values,... 

Una vez hayamos terminado de trabajar con el objeto Shelf, lo cerrare- 
mos utilizando el método cl ose. 

import shelve 

animales = ["piton", "mono", "camello"] 
lenguajes = ["python", "mono", "perl"] 

shelf = shelve.openCdatos.dat") 
shelf["primera"] = animales 
shelf["segunda"] = lenguajes 


print shelf["segunda"] 
shelf.close() 
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Existen problemas para los que guardar nuestros datos en ficheros de 
texto plano, en archivos XML, o mediante serializacion con pickle o 
s hel ve pueden ser soluciones poco convenientes. En ocasiones no que- 
da mås remedio que recurrir a las bases de datos, ya sea por cuestiones 
de escalabilidad, de interoperabilidad, de coherencia, de seguridad, de 
confidencialidad, etc. 

A lo largo de este capftulo aprenderemos a trabajar con bases de 
datos en Python. Sin embargo se asumen una serie de conocimientos 
båsicos, como puede ser el manejo elemental de SQL. Si este no es el 
caso, existen miles de recursos a disposicion del lector en Internet para 
introducirse en el manejo de bases de datos. 


DB API 

Existen cientos de bases de datos en el mercado, tanto comerciales 
como gratuitas.También existen decenas de modulos distintos para 
trabajar con dichas bases de datos en Python, lo que significa decenas 
de APIs distintas por aprender. 

En Python, como en otros lenguajes como Java con JDBC, existe una 
propuesta de API eståndar para el manejo de bases de datos, de forma 
que el codigo sea pråcticamente igual independientemente de la base 
de datos que estemos utilizando por debajo. Esta especificacion recibe 
el nombre de Python Database API o DB-API y se recoge en el PEP 
249 (http://www.python.org/dev/peps/pep-0249/). 


DB-API se encuentra en estos momentos en su version 2.0, y existen 
implementaciones para las bases de datos relacionales mås conocidas, 
asi como para aigunas bases de datos no relacionales. 
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A lo largo de este capitulo utilizaremos la base de datos SQLite para 
los ejemplos, ya que no se necesita instalar y ejecutar un proceso ser- 
vidor independiente con el que se comunique el programa, sino que se 
trata de una pequena libreria en C que se integra con la aplicacion y 
que viene incluida con Python por defecto desde la version 2.5. Desde 
la misma version Python también incorpora un modulo compatible 
con esta base de datos que sigue la especificacion de DB API 2.0: 
sqli te3, por lo que no necesitaremos ningun tipo de configuracion 
extra. 

Nada impide al lector, no obstante, instalar y utilizar cualquier otra 
base de datos, como MySQL, con la cuål podemos trabajar a través 
del driver compatible con DB API 2.0 MySQLdb (http://mysql-python. 
sourceforge. net/). 

Variables globales 

Antes de comenzar a trabajar con sqlite3, vamos a consultar algunos 
datos interesantes sobre el modulo. Todos los drivers compatibles con 
DB-API 2.0 deben tener 3 variables globales que los describen. A 
saber: 

• api level: una cadena con la version de DB API que utiliza. Ac- 
tualmente solo puede tomar como valor “1.0” o “2.0”. Si la variable 
no existe se asume que es 1.0. 

• threadsafety: se trata de un entero de 0 a 3 que describe lo seguro 
que es el modulo para el uso con threads. Si es 0 no se puede com- 
partir el modulo entre threads sin utilizar aigun tipo de mecanis- 
mo de sincronizacion; si es 1, pueden compartir el modulo pero no 
las conexiones; si es 2, modulos y conexiones pero no cursores y, 
por ultimo, si es 3, es totalmente thread-safe. 

• paramstyle: informa sobre la sintaxis a utilizar para insertar valores 
en la consulta SQL de forma dinåmica. 

qmark: interrogaciones. 
sql = "select all from t where valor=?" 
numeric: un numero indicando la posicion. 
sql = "select all from t where valor=:1" 
n amed: el nombre del valor. 
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sql = "select all from t where valor=:valor" 
format: especificadores de formato similares a los del printf 
de C. 

sql = "select all from t where valor=%s" 

* py format: similar al anterior, pero con las extensiones de 
Python. 

sql = "select all from t where valor=%(valor)" 


Veamos los valores correspondientes a sqlite3: 

»> import sqlite3 as dbapi 
»> print dbapi. apilevel 
2.0 

»> print dbapi. threadsafety 
1 

»> print dbapi. paramstyle 
qmark 


Excepciones 

A continuacion podéis encontrar la jerarquia de excepciones que deben 
proporcionar los modulos, junto con una pequena descripcion de cada 
excepcion, a modo de referenda. 

StandardError 

I_Warning 

I_Error 

I_InterfaceError 

I_DatabaseError 

I_DataError 

I_OperationalError 

I_IntegrityError 

I_InternalError 

I_ProgrammingError 

I_NotSupportedError 


StandardError: Super clase para todas las excepciones de DB API. 
Warning: Excepcion que se lanza para avisos importantes. 

Error: Super clase de los errores. 

InterfaceError: Errores relacionados con la interfaz de la base de 
datos, y no con la base de datos en si. 

DatabaseError: Errores relacionados con la base de datos. 
DataError: Errores relacionados con los datos, como una division 
entre cero. 
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• Oper at iona 1 Error: Errores relacionados con el funcionamiento de 
la base de datos, como una desconexion inesperada. 

• Integri tyError: Errores relacionados con la integridad referencial. 

• InternalError: Error interno de la base de datos. 

• ProgrammingError: Errores de programacion, como errores en el 
codigo SQL. 

• NotSupportedError: Excepcion que se lanza cuando se solicita un 
método que no estå soportado por la base de datos. 

Uso båsico de DB-API 

Pasemos ahora a ver como trabajar con nuestra base de datos a través 
de DB-API. 

Lo primero que tendremos que hacer es realizar una conexion con el 
servidor de la base de datos. Esto se hace mediante la funcion connect, 
cuyos paråmetros no estån estandarizados y dependen de la base de 
datos a la que estemos conectåndonos. 

En el caso de sqlite3 solo necesitamos pasar como paråmetro una 
cadena con la ruta al archivo en el que guardar los datos de la base de 
datos, o bien la cadena ": memory :" para utilizar la memoria RAM en 
lugar de un fichero en disco. 

Por otro lado, en el caso de MySQLdb, connect toma como paråmetros 
la måquina en la que corre el servidor (host), el puerto (port), nombre 
de usuario con el que autenticarse (user), contrasena (password) y base 
de datos a la que conectarnos de entre las que se encuentran en nuestro 
SGBD (db). 

La funcion connect devuelve un objeto de tipo Connection que repre¬ 
senta la conexion con el servidor. 

»> bbdd = dbapi.connectCbbdd.dat") 

»> print bbdd 

<sqlite3.Connection object at ØxØØA71DAØ> 

Las distintas operaciones que podemos realizar con la base de datos se 
realizan a través de un objeto Cursor. Para crear este objeto se utiliza el 
método cursor() del objeto Connection: 


120 



Bases de datos 


c = bbdd.cursor() 

Las operaciones se ejecutan a través del método execute de Cursor, pa- 
sando como paråmetro una cadena con el codigo SQL a ejecutar. 

Como ejemplo creemos una nueva tabla empleados en la base de datos: 

c.execute("""create table empleados (dni text, 
nombre text, 
departamento text)""") 

y a continuacion, insertemos una tupla en nuestra nueva tabla: 

c.execute("""insert into empleados 

values ('12345678-A f , 'Manuel Gi1', 'Contabili- 

dad')""") 

Si nuestra base de datos soporta transacciones, si estas estån activadas, 
y si la caracteristica de auto-commit estå desactivada, serå necesario 
llamar al método commit de la conexion para que se lleven a cabo las 
operaciones definidas en la transaccion. 

Si en estas circunstancias utilizåramos una herramienta externa para 
comprobar el contenido de nuestra base de datos sin hacer primero el 
commit nos encontrariamos entonces con una base de datos vada. 

Si comprobåramos el contenido de la base de datos desde Python, sin 
cerrar el cursor ni la conexion, recibiriamos el resultado del contexto 
de la transaccion, por lo que pareceria que se han llevado a cabo los 
cambios, aunque no es asi, y los cambios solo se aplican, como comen- 
tamos, al llamar a commit. 

Para bases de datos que no soporten transacciones el eståndar dic- 
ta que debe proporcionarse un método commit con implementacion 
vada, por lo que no es mala idea llamar siempre a commit aunque no 
sea necesario para poder cambiar de sistema de base de datos con solo 
modificar la linea del import. 

Si nuestra base de datos soporta la caracteristica de rollback también 
podemos cancelar la transaccion actual con: 
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bbdd.rollback() 

Si la base de datos no soporta rollback llamar a este método producirå 
una excepcion. 

Veamos ahora un ejemplo completo de uso: 

import sqlite3 as dbapi 

bbdd = dbapi.connectCbbdd.dat") 
cursor = bbdd.cursor() 

cursor.execute("""create table empleados (dni text, 
nombre text, 
departamento text)""") 

cursor.execute("""insert into empleados 

values ('12345678-A f , 'Manuel Gi1', 'Con- 

tabilidad')""") 
bbdd.commit() 

cursor.execute("""select * from empleados 

where departamento='Contabi1idad'""") 

for tupla in cursor.fetchall(): 
print tupla 

Como vemos, para realizar consultas a la base de datos también se 
utiliza execute. Para consultar las tuplas resultantes de la sentencia 
SQL se puede llamar a los métodos de Cursor fetchone, fetchmany o 
fetchall o usar el objeto Cursor como un iterador. 

cursor.execute("""select * from empleados 

where departamento='Contabi1idad'""") 

for resultado in cursor: 
print tupla 

El método fetchone devuelve la siguiente tupla del conjunto resultado 
o None cuando no existen mås tuplas, fetchmany devuelve el numero de 
tuplas indicado por el entero pasado como paråmetro o bien el nu¬ 
mero indicado por el atributo Cursor. array size si no se pasa ningun 
paråmetro (Cursor. arraysize vale 1 por defecto) y fetchall devuelve 
un objeto iterable con todas las tuplas. 
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A la hora de trabajar con selects u otros tipos de sentencias SQL es 
importante tener en cuenta que no deberian usarse los métodos de 
cadena habituales para construir las sentencias, dado que esto nos hana 
vulnerables a ataques de inyeccion SQL, sino que en su lugar debe 
usarse la caracteristica de sustitucion de paråmetros de DB APL 

Supongamos que estamos desarrollando una aplicacion web con 
Python para un banco y que se pudiera consultar una lista de sucur- 
sales del banco en una ciudad determinada con una URL de la forma 
http://www.mibanco.com/sucursales?ciudad=Madrid 

Podriamos tener una consulta como esta: 

cursor.execute("""select * from sucursales 
where ciudad='" + ciudad + 

A primera vista podria parecer que no existe ningun problema: no 
hacemos mås que obtener las sucursales que se encuentren en la ciudad 
indicada por la variable ciudad. Pero, ^qué ocurriria si un usuario ma- 
lintencionado accediera a una URL como “http://www.mibanco.eom/s 
ucursales?ciudad=Madrid’;SELECT * FROM contrasenyas”? 

Como no se realiza ninguna validacion sobre los valores que puede 
contener la variable ciudad, seria sencillo que alguien pudiera hacerse 
con el control total de la aplicacion. 

Lo correcto seria, como deciamos, utilizar la caracteristica de sustitu¬ 
cion de paråmetros de DB APL El valor de paramstyle para el modulo 
sqlite3 era qmark. Esto significa que debemos escribir un signo de 
interrogacion en el lugar en el que queramos insertar el valor, y basta 
pasar un segundo paråmetro aexecute en forma de secuencia o map- 
ping con los valores a utilizar para que el modulo cree la sentencia por 
nosotros. 

cursor.execute("""select * from sucursales 
where ciudad=?""", (ciudad,)) 

Por ultimo, al final del programa se debe cerrar el cursor y la conexion: 
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cursor.close() 
bbdd.close() 

Tipos SQL 

En ocasiones podemos necesitar trabajar con tipos de SQL, y almace- 
nar, por ejemplo, fechas u horas usando Date y Time y no con cadenas. 
La API de bases de datos de Python incluye una serie de constructores 
a utilizar para crear estos tipos. Estos son: 

• Date(year, month, day): Para almacenar fechas. 

• Time(hour, mi nu te, s econd): Para almacenar horas. 

• Timestamp(year, month, day, hour, minute, second):Para 
almacenar timestamps (una fecha con su hora). 

• DateFromTicks( ticks): Para crear una fecha a partir de un numero 
con los segundos transcurridos desde el epoch (el 1 de Enero de 
1970 alas 00:00:00 GMT). 

• TimeFromTicks( ticks): Similar al anterior, para horas en lugar de 
fechas. 

• TimestampFromTicks( ticks): Similar al anterior, para timestamps. 

• Binary(string): Valor binario. 

Otras opciones 

Por supuesto no estamos obligados a utilizar DB-API, ni bases de 
datos relacionales. En Python existen modulos para trabajar con bases 
de datos orientadas a objetos, como ZODB (Zope Object Database) 
y motores para mapeo objeto-relacional (ORM) como SQLAlchemy, 
SQLObject o Storm. 

Ademås, si utilizamos IronPython en lugar de CPython tenemos la 
posibilidad de utilizar las conexiones a bases de datos de .NET, y si 
utilizamos Jython, las de Java. 
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Docstrings 

En capitulos anteriores ya comentamos en varias ocasiones que todos 

los objetos cuentan con una variable especial_doc_mediante la que 

indicar el proposito y uso del objeto. Estos son los llamados docstrings 
o cadenas de documentacion. 

A estos atributos se les puede asociar el texto correspondiente explici- 
tamente, asignåndolo al literal cadena correspondiente, como con cual- 
quier otra variable. Sin embargo, por conveniencia, Python ofrece un 
mecanismo mucho mås sencillo y es que si el primer estamento de la 

definicion del objeto es una cadena, esta se asocia a la variable_doc_ 

automåticamente. 

def haz_algo(arg): 

"""Este es el docstring de la funcion.""" 
print arg 

print haz_algo._doc_ 

haz_algo._doc_ = """Este es un nuevo docstring.""" 

print haz_algo._doc_ 

Como vemos lo interesante de estas cadenas es que, a diferencia de los 
comentarios normales de Python y de los comentarios de otros lengua- 
jes, las cadenas de documentacion no se eliminan del bytecode, por lo 
que se pueden consultar en tiempo de ejecucion, usando, por ejemplo, 
la funcion help del lenguaje, o utilizando la sentencia print como en el 
ejemplo anterior. 

»> help(haz_algo) 

Help on function haz_algo in module _main_: 

haz_algo(arg) 
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Este es un nuevo docstring. 

Pydoc 

La funcion help, que comentamos brevemente con anterioridad, 
utiliza el modulo pydoc para generar la documentacion de un objeto a 
partir de su docstring y los docstrings de sus miembros. Este modulo, 
incluido por defecto con Python desde la version 2.1, se puede impor¬ 
tar en nuestro codigo Python y utilizarse programaticamente, o bien se 
puede utilizar como una herramienta de linea de comandos que seria el 
equivalente a la aplicacion Javadoc del mundo Java. 

pydoc puede mostrar la informacion como texto en la consola, tal como 
lo utiliza help, pero también puede generar archivos HTML como 
javadoc o facilitar la informacion a través de un pequeno servidor web 
incluido con el modulo. 

Pydoc es muy sencillo de utilizar. Con 
pydoc.py nombrel [nombre2 ...] 

se muestra la documentacion del tema, modulo, clase, paquete, fun¬ 
cion o palabra clave indicada de forma similar a la funcion help. Si el 
nombre es keywords, topics o modules se listarån las distintas palabras 
claves, temas y modulos respectivamente. 

Si se pasa el flag -w, el script guardarå la documentacion en uno o 
varios archivos html en lugar de mostrarla por pantalla. 

pydoc.py -w nombrel [nombre2 ...] 

El flag - k sirve para buscar una determinada palabra en las sinopsis 
de todos los modulos disponibles. La sinopsis es la primera linea de la 
cadena de documentacion. 

pydoc.py -k xml 

Con - p podemos iniciar el servidor HTTP en el puerto indicado. 


pydoc.py -p puerto 
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Una vez hecho esto podemos acceder a la documentacion de todos 
los modulos disponibles abriendo la pagina http://localhost:puerto en 
nuestro navegador. 

Por ultimo, mediante el flag - g podemos lanzar una interfaz gråfica 
para buscar documentacion que utiliza el servidor HTTP para mostrar 
los resultados. 

Epydoc y reStructuredText 

El problema de pydoc es que es muy simple, y no permite anadir 
semåntica o modificar estilos de la documentacion. No podemos, por 
ejemplo, indicar que en una linea en concreto de entre las lineas de 
documentacion de la funcion describe un paråmetro de la funcion o 
mostrar un cierto término en cursiva. 

Existen proyectos para generar documentacion con funcionalidades 
mås avanzadas como Docutils, Epydoc o Sphinx, aunque es necesario 
aprender sintaxis especiales. 

Docutils es un proyecto desarrollado por David Goodger que in- 
cluye distintas herramientas para generar documentacion utilizando 
el formato reStructuredText, un formato de texto plano creado por 
el mismo autor, y que es el formato mås utilizado en la comunidad 
Python. reStructuredText se utiliza, entre otros, para la creacion de los 
PEPs (Python Enhancement Proposals). 

Sin embargo, actualmente Docutils es mås indicado para generar 
documentos a partir de archivos de texto, y no a partir de docstrings 
extraidos de codigo fuente Python, ya que el parser encargado de este 
trabajo dista mucho de estar terminado. 

EpyDoc es una de las herramientas de generacion de documentacion 
para Python mås utilizadas. Ademås de texto plano y de su propio 
formato, llamado epytext, soporta reStructuredText y sintaxis Javadoc, 
cosa que los programadores Java agradecerån. 

A lo largo del resto del capitulo utilizaremos reStructuredText como 
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lenguaje de marcado y EpyDoc para generar los documentos finales. 

Epydoc se puede descargar desde su pagina web en forma de instala- 
dor exe para Windows, paquete RPM para Fedora o similares, o en 
archivos zip y tar.gz que incluyen scripts de instalacion: http://epydoc. 
sourceforge.net /. También se encuentra en los repositorios de varias 
distribuciones Linux. 


Una vez hayamos instalado Epydoc siguiendo el método adecuado 
para nuestro sistema operativo tendremos acceso a su funcionalidad 
a través de dos interfaces de usuario distintas: el script epydoc, que 
consiste en una aplicacion de lfnea de comandos,y el script epydocgui 
(epydoc. pyw en Windows), que ofrece una interfaz gråfica. Ademås 
también podemos acceder a la funcionalidad de epydoc programatica- 
mente, como en el caso de pydoc. 


Vamos a crear un pequeno modulo con un par de clases para ver pri¬ 
mero el resultado de utilizar epydoc con docstrings de texto plano, sin 
ningun tipo de marcado especial. 

"""Modulo para ejemplificar el uso de epydoc.""" 

class Persona: 

"""Mi clase de ejemplo.""" 

def _init_(se1f, nombre): 

"""Inicializador de la clase Persona.""" 
self.nombre = nombre 
self.mostrar_nombre() 

def mostrar_nombre(self): 

"""Imprime el nombre de la persona""" 
print "Esta es la persona %s" % self.nombre 

class Empleado(Persona): 

"""Subclase de Persona.""" 
pass 

if_name_== "_main_ 

raul = Persona("Raul") 


El formato de salida por defecto de epydoc es HTML. Por lo tanto 
para generar la documentacion en forma de documentos HTML bas- 
tarfa escribir algo asf: 
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epydoc ejemplo.py 
o bien 

epydoc --html ejemplo.py 

Para generar un archivo PDF, utilizando LaTeX, se utilizaria el flag 
--pdf: 

epydoc --pdf ejemplo.py 

Si LaTeX no estå instalado o epydoc no encuentra el ejecutable no serå 
posible generar el PDF. 

También podemos indicar el nombre del proyecto y la URL mediante 
las opciones - -name y - -url: 

epydoc --name Ejemplo --url http://mundogeek.net ejemplo.py 

E incluso anadir diagramas mostrando la clase base y subclases 
(--graph classtree), las llamadas entre funciones y métodos (--graph 
ca 11 graph), clases y subclases usando notacion UML (--graph uml- 
classtree) o todos ellos ( -- graph all). 

epydoc --graph all ejemplo.py 

Para generar el grafo de llamadas, no obstante, es necesario generar 
un archivo con la informacion necesaria utilizando el modulo profile 
o el modulo hot s hot e indicar el archivo resultante utilizando el flag 
--pstat: 

epydoc --graph all --pstat profile.out ejemplo.py 

Veamos ahora aigunas funcionalidades båsicas de marcado en reStruc- 
turedText. 

Para poner un texto en itålica se rodea el texto con asteriscos: 

* i tål ica* -> itålica 
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Para ponerlo en negrita, se utilizan dos asteriscos: 

**negrita** -> negrita 

Para mostrar el texto como monoespacio, por ejemplo para mostrar 
codigo inline, se utiliza 

"monoespacio" -> monoespacio 

Si necesitamos utilizar cualquiera de estos caracteres especiales, se 
pueden escapar utilizando la barra invertida. 

\* es un caråcter especial -> * es un caråcter especial 

Los titulos se crean anadiendo una linea de caracteres no alfanuméri- 
cos por debajo del texto, o por encima y por debajo del texto. Para crear 
un subtitulo basta utilizar una nueva combinacion. 

Titulo 


Subtitulo 


Titulo 

Subtitulo 

Para crear una lista no ordenada se empieza cada linea con el caracter 

c j c y 

, - o +: 

* Python 

* C 

* Java 

• Python 

• C 

• Java 

Para crear una lista numerada se empieza la linea con el numero se- 
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guido de un punto, o bien con el simbolo ‘#’ para que se introduzca el 
numero automåticamente. 

1. Python 

2. C 

3. Java 

1. Python 

2. C 

3. Java 

Para describir propiedades de los elementos que estamos documen- 
tando se utilizan los campos o helds. En reStructuredText los campos 
comienzan con V, le sigue el nombre del campo y opcionalmente sus 
argumentos, y se cierra de nuevo con V, para terminar con el cuerpo 
del campo. 

Estos son algunos de los campos que soporta Epydoc: 


Funciones y métodos 

:param p: Un paråmetro 

Describe el paråmetro p. 

:type p: str 

Especihca el tipo esperado para el 
paråmetro p. 

:return: True si son 
iguales 

Valor de retorno. 

:rtype: str 

Tipo del valor de retorno. 

:keyword p: Un paråme¬ 
tro 

Descripcion del paråmetro con 
valor por defecto y nombre p. 

:raise e: Si el paråme¬ 
tro es cero 

Describe las circunstancias para 
las que se lanza la excepcion e. 


Variables 

:ivar v: Una variable 

Descripcion de la instancia v. 

:cvar v: Una variable 

Descripcion de la variable eståtica 
de clase v. 

:var v: Una variable 

Descripcion de la variable v del 
modulo. 
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:type v: str 


Tipo de la variable v. 


Notas 

:note: Una nota 

Una nota sobre el objeto. 

:attention: Importante 

Una nota importante sobre el 
objeto. 

:bug: No funciona para 
el valor 0 

Descripcion de un error en el 
objeto. 

:warning: Cuidado con 
el valor 0 

Una advertencia acerca de un 
objeto. 

:see: Ver 'Python para 
todos' 

Para indicar informacion relacio- 
nada. 


Estado 

:version: 1.0 

Version actual del objeto. 

:change: Version ini - 
cial 

Listado de cambios. 

:todo: Internacionali- 
zacion 

Un cambio planeado para el 
objeto. 

:status: Version esta- 
ble 

Estado del objeto. 


Autoria 

:author: Raul Gonzalez 

Autor o autores del objeto. 

:organization: Mundo 
geek 

Organizacion que creo o mantiene 
el objeto. 

:license: GPL 

Licencia del objeto. 

:contact: zootropo en 
gmail 

Informacion de contacto del autor. 


Para que Epydoc sepa que utilizamos reStructuredText es necesario 

indicarlo mediante una variable_ docformat _en el codigo, o bien 

mediante la opcion - - docf or mat de linea de comandos. Las opciones 
posibles son epytext, plaintext, restructuredtext o javadoc. 
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Veamos un ejemplo con campos: 

"""Modulo para ejemplificar el uso de *epydoc*. 

:author: Raul Gonzalez 
:version: 0.1""" 

_docformat_ = "restructuredtext" 

class Persona: 

"""Modela una persona.""" 

def_init_(se 1f, nombre, edad): 

"""Inicializador de la clase 'Persona'. 

:param nombre: Nombre de la persona. 

:param edad: Edad de la persona""" 
self.nombre = nombre 
self.edad = edad 
self.mostrar_nombre() 

def mostrar_nombre(self): 

"""Imprime el nombre de la persona""" 
print "Esta es la persona %s" % self.nombre 

class Empleado(Persona): 

"""Subclase de 'Persona' correspondiente a las personas 
que trabajan para la organizacion. 

:todo: Escribir implementacion.""" 
pass 

if_name_== "_main_": 

juan = Persona("Juan", 26) 

reStructuredText también soporta un segundo tipo de campos en el 
que el cuerpo del campo es una lista. De esta forma podemos, por 
ejemplo, describir todos los paråmetros de una funcion o método con 
un solo campo : Parameters :, en lugar de con un campo : par am: para 
cada paråmetro. 

class Persona: 

"""Modela una persona.""" 

def _init_(self, nombre, edad): 

"""Inicializador de la clase 'Persona'. 

:Parameters: 

- 'nombre': Nombre de la persona. 

- 'edad': Edad de la persona. 


self.nombre = nombre 
self.edad = edad 
self.mostrar_nombre() 
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Otros campos que admiten listas son : Exceptions : para indicar varias 
excepciones (: except:), :Variables: para comentar varias variables 
(:var:)o : I var i ables: para comentar varias instancias (: i var:). 
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Para asegurar en la medida de lo posible el correcto funcionamiento 
y la calidad del software se suelen utilizar distintos tipos de pruebas, 
como pueden ser las pruebas unitarias, las pruebas de integration, o las 
pruebas de regresion. 

A lo largo de este capitulo nos centraremos en las pruebas unitarias, 
mediante las que se comprueba el correcto funcionamiento de las 
unidades logicas en las que se divide el programa, sin tener en cuenta 
la interrelacion con otras unidades. 

La solution mås extendida para las pruebas unitarias en el mundo 
Python es unittest, a menudo combinado con doctest para pruebas 
mås sencillas. Ambos modulos estån incluidos en la libreria eståndar 
de Python. 

Doctest 

Como es de suponer por el nombre del modulo, doctest permite 
combinar las pruebas con la documentacion. Esta idea de utilizar las 
pruebas unitarias para probar el codigo y también a modo de docu¬ 
mentacion permite realizar pruebas de forma muy sencilla, propicia el 
que las pruebas se mantengan actualizadas, y sirve a modo de ejemplo 
de uso del codigo y como ayuda para entender su proposito. 

Cuando doctest encuentra una linea en la documentacion que co- 
mienza con ' »>' se asume que lo que le sigue es codigo Python a 
ejecutar, y que la respuesta esperada se encuentra en la linea o lineas 
siguientes, sin »>. El texto de la prueba termina cuando se encuentra 
una linea en blanco, o cuando se llega al final de la cadena de docu¬ 
mentacion. 
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Tomemos como ejemplo la siguiente funcion, que devuelve una lista 
con los cuadrados de todos los numeros que componen la lista pasada 
como paråmetro: 

def cuadrados(lista): 

"""Calcula el cuadrado de los numeros de una lista""" 
return [n ** 2 for n in lista] 

Podriamos crear una prueba como la siguiente, en la que comprobamos 
que el resultado al pasar la lista [ 0, 1, 2, 3 ] es el que esperåbamos: 

def cuadrados(lista): 

"""Calcula el cuadrado de los numeros de una lista 

»> 1 = [0, 1, 2, 3] 

»> cuadrados(l) 

[0, 1, 4, 9] 

ii ii H 

return [n ** 2 for n in lista] 

Lo que hacemos en este ejemplo es indicar a doctest que cree un lista 1 
con valor [ 0 , 1, 2, 3], que llame a continuacion a la funcion cuadra¬ 
dos con 1 como argumento, y que compruebe que el resultado devuelto 
sea igual a [ 0, 1, 4, 9 ]. 

Para ejecutar las pruebas se utiliza la funcion testmod del modulo, a la 
que se le puede pasar opcionalmente el nombre de un modulo a eva- 
luar (paråmetro name). En el caso de que no se indique ningun argu¬ 
mento, como en este caso, se evalua el modulo actual: 

def cuadrados(lista): 

"""Calcula el cuadrado de los numeros de una lista 

»> 1 = [0, 1, 2, 3] 

»> cuadrados(l) 

[0, 1, 4, 9] 

ii ii ii 

return [n ** 2 for n in lista] 

def _test(): 

import doctest 
doctest.testmod() 
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if_name_== "_main_ 

_test() 

En el caso de que el codigo no påse alguna de las pruebas que hemos 
definido, doet es t mostrarå el resultado obtenido y el resultado espe- 
rado. En caso contrario, si todo es correcto, no se mostrarå ningun 
mensaje, a menos que anadamos la opcion - v al llamar al script o el pa- 
råmetro verbose=True a la funcion tesmod, en cuyo caso se mostrarån 
todas las pruebas ejecutadas, independientemente de si se ejecutaron 
con éxito. 


Este seria el aspecto de la salida de doctest utilizando el paråmetro -v: 
Trying: 

l = [0, 1, 2, 3] 

Expecting nothing 
ok 

Trying: 

cuadrados(l) 

Expecting: 

[0, 1, 4, 9] 
ok 

2 items had no tests: 

_main_ 

_main_._test 

1 items passed all tests: 

2 tests in _main_.cuadrados 

2 tests in 3 items. 

2 passed and 0 failed. 

Test passed. 


Ahora vamos a introducir un error en el codigo de la funcion para 
ver el aspecto de un mensaje de error de doctest. Supongamos, por 
ejemplo, que hubieramos escrito un operador de multiplicacion (' * ') 
en lugar de uno de exponenciacion ('**'): 

def cuadrados(lista): 

"""Calcula el cuadrado de los numeros de una lista 

»> 1 = [0, 1, 2, 3] 

»> cuadrados(l) 

[0, 1, 4, 9] 

ii ii o 


return [n * 2 for n in lista] 


def _test(): 
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import doctest 
doctest.testmod() 

if_name_== "_main_ 

_test() 


Obtendriamos algo parecido a esto: 


********************************************************* 

File "ejemplo.py", line 5, in _main_.cuadrados 

Failed example: 

cuadrados(l) 

Expected: 

[0, 1, 4, 9] 

Got: 

[0, 2, 4, 6] 

********************************************************* 

1 items had failures: 

1 of 2 in _main_.cuadrados 

***Test Failed*** 1 failures. 


Como vemos, el mensaje nos indica que ha fallado la prueba de la lmea 
5, al llamar a cuadrados(1), cuyo resultado deberia ser [0, 1 , 4, 9],y 
sin embargo obtuvimos [ 0 , 2, 4, 6 ]. 

Veamos por ultimo como utilizar sentencias anidadas para hacer cosas 
un poco mås complicadas con doctest. En el ejemplo siguiente nuestra 
funcion calcula el cuadrado de un unico numero pasado como parå- 
metro, y disenamos una prueba que compruebe que el resultado es el 
adecuado para varias llamadas con distintos valores. Las sentencias 
anidadas comienzan con "..." en lugar de 

def cuadrado(num): 

"""Calcula el cuadrado de un numero. 

»> 1 = [0, 1, 2, 3] 

»> for n in 1: 

cuadrado(n) 

[0, 1, 4, 9] 

ii ii o 


return num ** 2 


def _test(): 

import doctest 
doctest.testmod() 
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if_name_== "_main_ 

_test() 

unittest / Pyllnit 

unit test, también llamado PyUnit, forma parte de una familia de 
herramientas conocida colectivamente como xUnit, un conjunto de 
frameworks basados en el software SUnit para Smalltalk, creado por 
Kent Beck, uno de los padres de la eXtreme Programming. Otros 
ejemplos de herramientas que forman parte de esta familia son JUnit 
para Java, creada por el propio Kent Beck iunto a Erich Gamma, o 
NUnit, para .NET. 

El uso de unittest es muy sencillo. Para cada grupo de pruebas tene¬ 
mos que crear una clase que herede de unit test. TestCase, y anadir 
una serie de métodos que comiencen con test, que serån cada una de 
las pruebas que queremos ejecutar dentro de esa bateria de pruebas. 

Para ejecutar las pruebas, basta llamar a la funcion main() del modulo, 
con lo que se ejecutarån todos los métodos cuyo nombre comience con 
test, en orden alfanumérico. Al ejecutar cada una de las pruebas el 
resultado puede ser: 

• OK: La prueba ha pasado con éxito. 

• FAIL: La prueba no ha pasado con éxito. Se lanza una excepcion 
AssertionError para indicarlo. 

• ERROR: Al ejecutar la prueba se lanzo una excepcion distinta de 
AssertionError. 

En el siguiente ejemplo, dado que el método que modela nuestra prue¬ 
ba no lanza ninguna excepcion, la prueba pasaria con éxito. 

import unittest 

c lass EjemploPruebas(unit test.TestCase): 
def test(self): 
pass 

if_name_== "_main_ 

unittest.main() 
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En este otro, sin embargo, fallaria: 
import unittest 

c lass EjemploPruebas(unit test.TestCase): 
def test(self): 

raise AssertionError() 

if_name_== "_main_ 

unittest.main() 

Nada nos impide utilizar clåusulas if para evaluar las condiciones que 
nos interesen y lanzar una excepcion de tipo AssertionError cuando 
no sea asi, pero la clase TestCase cuenta con varios métodos que nos 
pueden facilitar la tarea de realizar comprobaciones sencillas. Son los 
siguientes: 

• assertAlmostEqual(first, second, places=7, msg=None): 
Comprueba que los objetos pasados como paråmetros sean iguales 
hasta el séptimo decimal (o el numero de decimales indicado por 
places). 

• assertEqual(f irst, second, msg=None): Comprueba que los 
objetos pasados como paråmetros sean iguales. 

• assertFalse(expr, msg=None): Comprueba que la expresion sea 
falsa. 

• assertNotAlmostEqual(first, second, places=7, msg=None): 
Comprueba que los objetos pasados como paråmetros no sean 
iguales hasta el séptimo decimal (o hasta el numero de decimales 
indicado por places). 

• assertNotEqual(f irst, second, msg=None): Comprueba que los 
objetos pasados como paråmetros no sean iguales. 

• assertRaises(excClass, callableObj, *args, **kwargs): 
Comprueba que al llamar al objeto callableObj con los paråme¬ 
tros definidos por *args y **kwargs se lanza una excepcion de tipo 
excClass. 

• assertTrue(expr, msg=None): Comprueba que la expresion sea 
cierta. 

• assert_(expr, msg=None): Comprueba que la expresion sea cierta. 

• fail(msg=None): Falla inmediatamente. 

• faillf (expr, msg=None): Falla si la expresion es cierta. 

• fail!fAlmostEqual(first, second, places=7, msg=None): Falla 
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si los objetos pasados como paråmetros son iguales hasta el sépti- 
mo decimal (o hasta el numero de decimales indicado por pi aces). 

• fai 11 fEqua 1 (f irst, second, msg=None): Falla si los objetos pasa¬ 
dos como paråmetros son iguales. 

• f ailUnless(expr, msg=None): Falla a menos que la expresion sea 
cierta. 

• failUnlessAlmostEqual(first, second, places=7, msg=None): 
Falla a menos que los objetos pasados como paråmetros sean 
iguales hasta el séptimo decimal (o hasta el numero de decimales 
indicado por pi aces). 

• failUnlessEqual(f irst, second, msg=None): Falla a menos que 
los objetos pasados como paråmetros sean iguales. 

• failUnlessRaises(excClass, callableObj, *args, **kwargs): 
Falla a menos que al llamar al objeto callableObj con los paråme¬ 
tros definidos por *args y **kwargs se lance una excepcion de tipo 
excClass. 

Como vemos todos los métodos cuentan con un paråmetro opcional 
msg con un mensaje a mostrar cuando dicha comprobacion falle. 

Retomemos nuestra pequena funcion para calcular el cuadrado de un 
numero. Para probar el funcionamiento de la funcion podriamos hacer, 
por ejemplo, algo asi: 

import unittest 
def cuadrado(num): 

"""Calcula el cuadrado de un numero.""" 
return num ** 2 

c lass EjemploPruebas(unit test.TestCase): 
def test(self): 

i = [0, 1, 2, 3] 
r = [cuadrado(n) for n in 1] 
self.assertEqual(r, [0, 1, 4, 9]) 

if_name_== "_main_": 

unittest.main() 

Preparacion del contexto 

En ocasiones es necesario preparar el entorno en el que queremos que 
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se ejecuten las pruebas. Por ejemplo, puede ser necesario introducir 
unos valores por defecto en una base de datos, crear una conexion con 
una måquina, crear aigun archivo, etc. Esto es lo que se conoce en el 
mundo de xUnit como testfixture. 


La clase TestCase proporciona un par de métodos que podemos sobre- 
escribir para construir y desconstruir el entorno y que se ejecutan antes 
y después de las pruebas definidas en esa clase. Estos métodos son 
setUp() y tearDown(). 

c lass EjemploFixture(unit test.TestCase): 

def setllp(self): 

print "Preparando contexto" 
self.lista = [0, 1, 2, 3] 

def test(self): 

print "Ejecutando prueba" 
r = [cuadrado(n) for n in self.lista] 
self.assertEqual(r, [0, 1, 4, 9]) 

def tearDown(self): 

print "Desconstruyendo contexto" 
del self.lista 
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Una vez terminemos con el desarrollo de nuestra nueva aplicacion es 
conveniente empaquetarla de forma que sea sencillo para los usuarios 
instalarla, y para nosotros distribuirla. 

En Python existen dos modulos principales para este cometido: di s tu - 
t i Is, que es parte de la libreria eståndar y era el método mås utilizado 
hasta hace poco, y setuptools, que extiende la funcionalidad de di s tu - 
t i 1 s y es cada vez mås popular. 

En este capitulo veremos el funcionamiento de ambas herramientas, y 
terminaremos explicando como crear ejecutables .exe para Windows a 
partir de nuestro programa en Python. 

distutils 

Todo programa distribuido con distutils contiene un script llama- 
do por convencion setup.py, que se encarga de instalar la aplicacion 
llamando a la funcion setup de distutils . core. Esta funcion tiene 
montones de argumentos, que controlan, entre otras cosas, como insta¬ 
lar la aplicacion. 

Destinados a describir la aplicacion tenemos los siguientes argumen¬ 
tos: 
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• name: El nombre del paquete. 

• version: El numero de version. 

• description: Una linea describiendo el paquete. 

• long_description: Descripcion completa del paquete. 

• author: Nombre del autor de la aplicacion. 

• author_email: Correo electronico del autor. 

• maintainer: Nombre de la persona encargada de mantener el 
paquete, si difiere del autor. 

• maintainer_email: Correo de la persona encargada de mantener el 
paquete, si difiere del autor. 

• url: Web de la aplicacion. 

• download_url: Url de la que descargar la aplicacion. 

• 1 i c e n s e : Licencia de la aplicacion 

También tenemos argumentos que controlan los archivos y directo- 
rios que deben instalarse, como son packages, py_modules, scripts y 
ext_modules. 

El paråmetro scripts, que es una lista de cadenas, indica el nombre 
del modulo o modulos principales, es decir, los que ejecuta el usuario. 
Si nuestra aplicacion consistiera, por ejemplo, en un solo script ejem- 
plo.py, el codigo de setup.py podrfa tener un aspecto similar al siguien- 
te: 


from distutils.core import setup 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils" 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http://mundogeek.net/tutorial-python/", 

license="GPL", 

scripts=["ejemplo.py"] 


Si hemos escrito otros modulos para ser utilizados por el script prin¬ 
cipal, estos se indican mediante el paråmetro py_modules. Por ejemplo, 
supongamos que la aplicacion consiste en un script principal ejemplo. 
py, y un modulo de apoyo apoyo.py: 

from distutils.core import setup 
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setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils" 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url = "http://mundogeek.net/tu torial-python/", 

1icense="GPL", 

serip t s=["ejemplo.py" ], 

py_modules=["apoyo"] 

) 


Para instalar paquetes Python (directorios que contienen varios mo¬ 
dulos y un archivo_init_.py) usariamos el paråmetro packages. Si 

ademås del modulo ejemplo.py quisiéramos instalar los paquetes gu i y 
bbdd, por ejemplo, hariamos algo asi: 

from distutils.core import setup 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils" 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url = "http://mundogeek.net/tu torial-python/", 

1icense="GPL", 

serip t s=["ejemplo.py"], 

packages=["gui", "bbdd"] 


ext_modules, por ultimo, sirve para ineluir extensiones que utilice el 
programa, en C, C++, Fortran,... 

Veamos ahora como se utilizaria el archivo setup.py una vez creado. 

Al ejecutar el comando 

python setup.py install 

los modulos y paquetes especificados por py_modules ypackages se 
instalan en el directorio Lib de Python. Los programas indicados en 
scripts, se copian al directorio Scripts de Python. 

Una vez hemos comprobado que la aplicacion se instala correctamente, 
procedemos a crear archivos mediante los que distribuir la aplicacion 
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a los usuarios. Para crear archivos con el codigo fuente se utiliza la op- 
cion sdist de setup.py, que crea por defecto un archivo tar.gz en Unix 
y un zip en Windows. 

python setup.py sdist 

Sin embargo se puede utilizar - - formats para especificar el formato o 
formatos que queramos generar 


bztar 

.tar.bz2 

gztar 

.tar.gz 

tar 

.tar 

zip 

.zip 

ztar 

.tar.Z 


Para crear un archivo tar.bz2, un tar.gz y un zip, por ejemplo, se utiliza- 
ria la siguiente orden: 

python setup.py sdist --formats=bztar,gztar,zip 

Para generar un archivo de distribucion binaria, se usa la opcion bdist: 
python setup.py bdist 

Los formatos que soporta bdist son los siguientes: 


rpm 

RPM 

gztar 

.tar.gz 

bztar 

.tar.bz2 

ztar 

.tar.Z 

tar 

.tar 

wininst 

Instalador Windows 

zip 

.zip 


Para crear un archivo rpm y un instalador de Windows, por ejemplo, 
escribiriamos: 
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python setup.py bdist --formats=wininst,rpm 

También es posible crear otros tipos de archivos de distribution utili- 
zando scripts que extienden distutils, como es el caso de los paquetes 
deb mediante el script stdeb (http://stdeb.python-hosting.com/) 

setuptools 

setuptools extediende distutils anadiendo una serie de funcionalidades 
muy interesantes: introduce un nuevo formato de archivo para distri¬ 
bucion de aplicaciones Python llamado egg> se encarga de buscar todos 
los paquetes que deben instalarse y anadir las posibles dependencias, 
permite instalar paquetes de PyPI con un solo comando, etc. 

Ademås, como setuptools se basa en distutils, un script de instalacion 
båsico utilizando setuptools es pråcticamente igual a su equivalente 
con distutils. Tan solo cambiaria la sentencia de importacion. 

from setuptools import setup 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url = "http://mundogeek.net/tu torial-python/", 

license="GPL", 

scripts=["ejemplo.py"], 

) 

El unico inconveniente que podriamos encontrar al uso de setuptools 
es que no estå incluido por defecto en Python 2.5, aunque es probable 
que esto cambie en proximas versiones debido a su gran uso. Pero los 
desarrolladores de setuptools han pensado en todo, e incluso esto no 
deberia suponer ningun problema, ya que con un mmimo esfuerzo 
por nuestra parte podemos hacer que setuptools se descargue e instale 
automåticamente en la måquina del usuario si este no se encuentra 
ya en el sistema. Basta distribuir con nuestro paquete un pequeno 
modulo extra ez_setup.py que viene incluido por defecto con setup¬ 
tools (http://peak.telecommunity.com/dist/ez_setup.py) y llamar a la 
funcion use_setuptools del modulo al inicio de setup.py: 
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from ez_setup import use_setuptools 
use_setuptools() 

from setuptools import setup 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils" 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url = "http://mundogeek.net/tu tor i al-python/", 

1icense="GPL", 

serip t s=["ejemplo.py" ], 


Veamos ahora con mås detenimiento algunos de los cambios y noveda- 
des que introduce setuptools. 


Integracion con PyPI 

Al estilo de CPAN en Perl setuptools permite instalar de forma facil 
y sencilla los paquetes pertenecientes a PyPI, el Indice de Paquetes 
Python (http://pypi.python.org/pypi), asi como subir nuestros propios 
paquetes. 

PyPI cuenta en el momento de escribir estas lineas con 4782 paquetes, 
por lo que poder instalar los paquetes de este repositorio con un simple 
comando supone una ayuda muy a tener en cuenta. 


Instalar un paquete de PyPI es tan sencillo como pasar al comando 
easy_install el nombre del paquete a instalar 

easy_install docutils 
Searching for docutils 

Reading http://pypi.python.org/simple/docutils/ 

Reading http://docutils.sourceforge.net/ 

Best match: docutils 0.5 

Downloading http://prdownloads.sourceforge.net/docutils/ 
docut iIs-0.5.tar.gz?download 
Processing docutils-Ø.5.tar.gz 

Running docutils-Ø.5/setup.py -q bdist_egg --dist-dir /tmp/ 
easy_install-wUAyllZ/docuti Is-0.5/egg-dist-tmp-kWkkkv 
"optparse" module already present; ignoring extras/optparse. 

py- 

"textwrap" module already present; ignoring extras/textwrap. 

py- 

zip_safe flag not set; analyzing archive contentsD 
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docutils.writers.newlatex2e._init_: module references 

_file_ 

docutils.writers.pep_html._init_: module references _ 

file_ 

docutils .writers . htmHcss 1._init_: module references_ 

file_ 

docutils.writers.s5_html._init_: module references _ 

file_ 

docutils.parsers.rst.directives.misc: module references 
_file_ 

Adding docutils 0.5 to easy-instal1.pth file 

Installing rst2pseudoxml.py script to /usr/bin 

Installing rst2html.py script to /usr/bin 

Installing rst21atex.py script to /usr/bin 

Installing rst2s5.py script to /usr/bin 

Installing rst2newlatex.py script to /usr/bin 

Installing rstpep2html.py script to /usr/bin 

Installing rst2xml.py script to /usr/bin 

Installed /usr/1ib/python2.5/site-packages/docutils-Ø.5- 

py2.5.egg 

Processing dependencies for docutils 
Finished processing dependencies for docutils 


Poder subir nuestros paquetes a PyPI requiere de un proceso un poco 
mås laborioso. Primero registramos los detalles de nuestra aplicacion 
en PyPI mediante la opcion register del script setup.py, el cuål nos 
preguntarå por nuestro nombre de usuario, contrasena y correo electro- 
nico si no tenemos cuenta en PyPI, o nombre de usuario y contrasena 
si nos registramos anteriormente: 

python setup.py register 
running register 
running egg_info 

creating Aplicacion_de_ejemplo.egg-info 

writing Aplicacion_de_ejemplo.egg-info/PKG-INFO 

writing top-level names to Aplicacion_de_ejemplo.egg-info/ 

top_level.txt 

writing dependency_links to Aplicacion_de_ejemplo.egg-info/ 
dependency_links.txt 

writing manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

reading manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

writing manifest file 'Aplicacion_de_ejemplo.egg-info/SOUR- 
CES.txt' 

We need to know who you are, so piease choose either: 

1. use your existing login, 

2. register as a new user, 

3. have the server generate a new password for you (and 
email it to you), or 
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4. quit 

Your selection [default 1]: 1 
Username: zootropo 
Password: 

Server response (200): OK 

I can store your PyPI login so future submissions will be 
faster. 

(the login will be stored in /home/zootropo/.pypirc) 

Save your login (y/N)?y 


Para crear y subir una distribucion con el codigo fuente de nuestra 
aplicacion se utiliza la opcion sdist upload: 

python setup.py sdist upload 


También podriamos crear y subir un egg (un formato de archivo para 
distribuir aplicaciones Python que veremos en la proxima seccion) 
utilizando la opcion bdist_egg upload: 

python setup.py bdist_egg upload 


O combinar los tres pasos en un solo comando: 

python setup.py register sdist bdist_egg upload 


Una vez subido el paquete cualquier persona podria instalarlo en su 
sistema utilizando easy_install, de la misma forma que cualquier otro 
paquete de PyPI: 

easy_install mi-paquete 

Eggs 

Los eggs (huevo en inglés) son archivos de extension .egg mediante los 
que distribuir aplicaciones en Python. Serian algo asi como el equiva- 
lente a los archivos .jar del mundo Java. Son multiplataforma, permi- 
ten manejar dependencias, y permiten instalar distintas versiones del 
mismo paquete. 


La forma mås sencilla de instalar aplicaciones distribuidas como 
archivos egg es mediante el comando easy_install, el cuål comentamos 
brevemente en el punto anterior al hablar sobre su uso para instalar 


150 



Distribuir aplicaciones Python 


paquetes de PyPI. Para instalar un archivo egg no tenemos mås que 
pasarie el nombre del archivo al comando easy_install: 

easy_install mi-aplicacion.egg 

o bien podemos pasarie la URL de la que descargar el egg: 
easy_install http://mundogeek.net/mi-aplicacion.egg 

Para construir nuestros propios eggs podemos utilizar el comando 
bdist_egg de setup.py, de forma similar a la manera en que construia- 
mos paquetes RPM o instaladores para Windows con distutils: 

python setup.py bdist_egg 

Otros cambios destacables 

Uno de los cambios mås interesantes es la incorporacion de un nue- 
vo argumento para la funcion setup llamado install_requires, que 
consiste en una cadena o lista de cadenas que indica los paquetes de los 
que depende la aplicacion. Si nuestra aplicacion necesitara tener insta- 
lado el paquete apoyo para poder ejecutarse, por ejemplo, escribiriamos 
lo siguiente: 

install_requires = ["apoyo"] 

Y de esta forma, easy_install se encargaria de buscar e instalar el pa¬ 
quete si fuera necesario, bien en PyPI, o en cualquier otro repositorio 
indicado por el paråmetro dependency_links. 

Ademås podemos especificar que se necesita una version concreta 
del paquete requerido, que sea mayor o menor que una cierta version, 
o que no se trate de una version determinada utilizando operadores 
relacionales (==, ! =, <, <=, >, >=): 

install_requires = ["apoyo >= 1.0 < 2.0"] 

También existen argumentos similares para declarar paquetes que 
deben instalarse para poder ejecutar el script de instalacion (setup_re- 
quires), para poder ejecutar las posibles pruebas incluidas con el 
paquete (tests_require) y para conseguir funcionalidades adicionales 
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(extras_require, que consiste en este caso en un diccionario). 

setuptools incluye también atajos utiles, como la funcion find_packa- 
ges () que nos evita tener que listar todos y cada uno de los paquetes 
que utiliza nuestro script en el paråmetro packages, como era el caso 
de distutils: 

from ez_setup import use_setuptools 

use_setuptools() 

from setuptools import setup, find_packages 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url = "http://mundogeek.net/tu torial-python/", 

license="GPL", 

scripts=["ejemplo.py"], 

packages = find_packages() 

) 

Crear ejecutables -exe 

Tanto en Mac OS como en la mayor parte de las distribuciones Linux 
el intérprete de Python estå instalado por defecto, por lo que los 
usuarios de estos sistemas no tienen mayor complicacion a la hora de 
instalar y ejecutar aplicaciones escritas en Python. 

En el caso de Windows, esto no es asi, por lo que seria interesante 
que los usuarios de este sistema operativo no tuvieran que instalar el 
intérprete de Python. También seria interesante que nuestro programa 
consistiera en un archivo .exe en lugar de uno o varios archivos .py, 
para simplificar las cosas. 

Todo esto lo podemos lograr gracias a py2exe, una extension para 
distutils que, como su nombre indica, permite crear ejecutables para 
Windows a partir de codigo Python, y que permite ejecutar estas apli¬ 
caciones sin necesidad de tener instalado el intérprete de Python en el 
sistema. 

Py2exe funciona examinando nuestro codigo fuente en busca de los 
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modulos y paquetes que utilizamos, compilåndolos y construyendo un 
nuevo archivo que incluye estos archivos y un pequeno intérprete de 
Python integrado. 

Para probar el funcionamiento de py2exe creemos un pequeno progra¬ 
ma ejemplo.py 

print "Soy un .exe" 

y el archivo setup.py correspondiente. Los cambios que tenemos que 
realizar a setup.py son sencillos: importar py2exe, y utilizar los argu¬ 
mentos console y Windows para indicar el nombre del script o scripts 
que queramos convertir en ejecutables de consola o ejecutables de 
interfaz gråfica, respectivamente. 

from distutils.core import setup 

import py2exe 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http://mundogeek.net/tutorial-python/", 

license="GPL", 

scripts=["ejemplo.py"], 

console=["ejemplo.py"] 

) 

Para crear el ejecutable, utilizamos una nueva opcion de linea de 
comandos para setup.py disponible tras importar el modulo y llamada, 
como no, py2exe: 

python setup.py py2exe 

Con esto py2exe generarå un directorio build, con las librerias com- 
piladas, y un directorio dist, con los archivos que conforman nuestra 
aplicacion. 

Entre los archivos que podemos encontrar en dist tendremos uno 
o varios ejecutables con el mismo nombre que los scripts indicados 
en console y Windows, un archivo python*.dll, que es el intérprete de 
Python, y un archivo library.zip, que contiene varios archivos pyc que 
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son los modulos que utiliza la aplicacion compilados. 

Si queremos reducir el numero de archivos a distribuir, podemos utili- 
zar la opcion - - bundle de py2exe para anadir a library.zip las dll y los 
pyd(- -bundle 2) o las dll, los pyd y el intérprete (--bundle i). 

python setup.py py2exe --bundle 1 


o bien podemos anadir un nuevo argumento options a la funcion setup 
que indique el valor a utilizar (opcion bundle_f iles), de forma que no 
tengamos que anadir el flag - - bundle cada vez que usemos el comando 
py2exe: 

from distutils.core import setup 
import py2exe 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http://mundogeek.net/tutorial-python/", 

license="GPL", 

scripts=["ejemplo.py"], 

console=["ejemplo.py"], 

options={"py2exe": {"bundle_files": 1}} 


Por ultimo podemos incluso prescindir de library.zip e incrustarlo en el 
ejecutable utilizando el argumento zipf ile=None 

from distutils.core import setup 
import py2exe 

setup(name="Aplicacion de ejemplo", 
version="0.1", 

description="Ejemplo del funcionamiento de distutils", 

author="Raul Gonzalez", 

author_email="zootropo en gmail", 

url="http://mundogeek.net/tutorial-python/", 

license="GPL", 

scripts=["ejemplo.py"], 

console=["ejemplo.py"], 

options={"py2exe": {"bundle_files": 1}}, 

zipfile=None 
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